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© Hepatitis C Virus Zellkultursystem 

© Das erfindungsgemaRe Hepatitis C Virus (HCV) Zellkul- 
tursystem besteht aus humanen Hepatomazellen, die mit 
einem HCV-RNA-Konstrukt transfiziert sind, das die HCV- 
spezifischen RNA-Abschnitte 5'NTR, NS3, NS4A, NS4B, 
NS5A, NS5B und 3'NTR und zudem wenigstens ein selek- 
tierbares Markergen (Selektionsgen) umfaftt. 
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Beschreibung 

Die Erfindung betrifft ein Hepatitis C Virus (HCV) Zellkullursyslem, das im wesentlichen eukaryontische Zellen um- 
faBt, die eingeschleustes HCV-spezifisches Genmaterial enthalten, d. h. die rait HCV-spezifischem Genmaterial transfi- 
5 ziert sind. 

Das Hepatitis C Virus (HCV) ist eine der Hauptursachen chronischer und sporadischer Lebererkrankungen weltweit. 
Die meisten HCV-Infektionen verlaufen ohne erkennbare klinische Syraptome, allerdings werden 80-90% der Infizier- 
ten dauerhafte Virustrager und bei 50% dieser dauerhaften Virustrager kommt es zu einer chronischen Leberentziindung 
mil unterschiedlichen Schweregraden. Ca. 20% der chronisch Infizierten entwickeln im Laufe von 10 bis 20 Jahren eine 

10 Leberzirrhose, auf deren Basis sich ein pri mares Leberzellkarzinom entwickeln kann. Die chronische Hepatitis C ist 
heute die Hauptindikation fur eine Lebertransplantation. Eine Kausaltherapie gibt es bisher noch nicht. Die einzige der- 
zeil verfugbare Therapie ist die hochdosierte Verabreichung von Interferon- Alpha oder eine Kombination aus Interferon- 
Alpha und dem Purin-Nukleosidanalogon Ribavirin. Allerdings sprechen nur ca. 60% aller Behandelten auf diese The- 
rapie an und bei diesen kommt es in mehr als der Halfte aller Falle nach dem Absetzen der Behandlung zu einer erneuten 

is Viramie. 

Aufgrund der hohen Pravalenz, geradc auch in den Industriclandcrn, den schwcrwiegenden Folgen chronischer Infek- 
tionen und dem Fehlen einer Kausaltherapie ist die Entwicklung einer HCV-spezifischen Chemotherapie ein wesentli- 
ches Ziel der pharmazeutischen Forschung und Entwicklung. Hauptproblem hierbei ist bisher das Fehlen eines geeigne- 
ten Zellkultursystems, das ein Studium der Virus-Replikation und der Pathogenese in eukaryontischen Zellen ermog- 
20 licht. 

Aufgrund der geringen Virusmengen im Blut bzw. Gewebe, dem Fehlen geeigneter Zellkultursysteme oder Tiermo- 
delle (bis heute ist der Schimpanse das einzige mbgliche Versuchsuer) sowie dem Fehlen effizienter Systeme zur Produk- 
tion virus-ahnlicher Partikel, konnte die molekulare Zusammensetzung des HCV-Partikels bis heute noch nicht einge- 
hend untersucht bzw. aufgeklart werden. Die derzeit vorliegenden Ergebnisse lassen sich wie folgt zusamnienfassen: Das 

25 HCV ist ein umhulltes Plusstrang RNA Virus mit einem Partikeldurchmesser von 50-60 nm und einer mittleren Dichte 
von 1,03-1,1 g/ml. Es wurde erstmals 1989 molekuiar kloniert und charakterisiert (Choo et al, 1989: Science, 244, 
359-362). Die HCV-RNA hat eine Lange von ca. 9.6 kb (= 9600 Nukleotide), eine positive Polaritat und besitzt ein ein- 
ziges offenes Leseraster (ORF = open reading frame), das ein lineares Polyprotein von ca 3010 Aminosauren kodiert 
(siehe Rice 1996, in Virology, B. N. Fields, D. M. Knipe, P. M. Howley, Eds. (Lippincott-Raven, Philadelphia, PA, 

30 1 996), vol. 1 , pp. 93 1-960; Clarke 1 997, J. Gen. Virol. 78, 2397; und Bartenschlager 1 997, Intcrvirology 40, 378 und vgl. 
Fig. 1 A). Bei der Virusreplikation wird das Polyprotein durch zellulare und virale Proteasen in die reifen und funktionell 
aktiven Proieine gespalten. 

Innerhalb des Polyproteins sind die Proteine wie folgt angeordnet (vom Amino- zum Carboxy terminus): Core-El-E2- 
p7-NS2-NS3-NS4A-NS4B-NS5A-NS5B. Das Core-Protein ist die Hauptkomponente des Nukleokapsids. Die Glyko- 

35 proteine El und E2 sind Transmembranproteine und Hauptkomponenten der Virushulle. Sie spielen wahrscheinlich bei 
der Anheftung des Virus an die Wirtszelle eine wesentliche Rolle. Diese drei Proteine Core, El und E2 bauen den Vi- 
ruspartikel auf und werden deshalb als Strukturproteine bczeichnet. Die Funktion des Proteins p7 ist noch unklar. Das 
Protein NS2 ist wahrscheinlich die katalytische Domane der NS2-3 Protease, die fiir die Prozesierung zwischen den Pro- 
teinen NS2 und NS3 verantwortlich ist. Das Protein NS3 hat zwei Funktionen, namlich in der aminoterminalen Domane 

40 eine Proteaseaktivitat, die fiir die Polyproteinprozessierung essentiell ist, und in der carboxytenninalen Domane eine 
NTPase/Helikase-Funktion, die wahrscheinlich bei der Replikation der viralen RNA eine Rolle spielt. Das Protein NS4A 
ist ein Kofaktor der NS3-Protcase. Die Funktion des Proteins NS4B ist unbckannt. 

Das offene Leseraster ist an seinem 5'Ende von einer ca. 340 Nukleotide langen nichttranslatierten Region (NTR = 
non-translated region) flankiert, die als interne Ribosomenansatzstelle (IRES = internal ribosome entry site) fungiert, und 

45 an seinem 3'Endc von einer ca. 230 Nukleotide langen NTR, die hochstwahrschcinlich fiir die Gcnomreplikation von Be- 
deutung ist. Eine solche 3OTR ist Gegenstand der Paten lanmeldung PCT/US 96/14033. Die Slrukturproteine in dem 
aminoterminalen Viertel des Polyproteins werden von der Signalpeptidase der Wirtszelle gespalten. Die Nicht-Struktur- 
proteine (NS) 2 bis (NS) 5B werden von zwei viralen Enzymen prozessiert, namlich von der NS2-3 und der NS3/4A Pro- 
teinase. Die NS3/4A Proteinase wird fiir alle Spallungen jenseits des Carboxylenninus von NS3 benotigt. Die Rolle von 

50 NS4B ist nicht bekannt. NS5A, ein hoch phosphoryliertes Protein, scheint fiir die Interferon Resistenz verschiedener 
HCV-Genotypen verantwortlich zu sein (vgl. Enomoto et al. 1995, J. Clin. Invest. 96, 224; Enomoto et al. 1996, N. Engl. 
J. Med. 334, 77; Gale Jr. et al. 1997, Virology 230, 217; Kaneko et al. 1994, Biochem. Biophys. Res. Commun. 205, 320; 
Reed et al., 1997, J. Virol. 71, 7187) und NS5B wurde als die RNA-abhangige RNA Polymerase identifiziert. 

Anhand dieser Erkcnntnissc wurden crstc Diagnoscsystcmc cntwickclt, die entweder auf dem Nachwcis von HCV- 

55 spezifischen Anukorpem in Pauentenserum oder auf dem Nachweis von HCV-spezifischer RNA miltels RT-PCR (= Re- 
verse Transcription Polymerase Chain Reaction) beruhen, und die mittlerweile routine- und/oder vorschriftsmaBig bei al- 
ien Blutkonscrvcn angewendet werden (musscn). 

Seit der Erstbeschreibung des Genoms 1989 wurden mil Hilfe der PCR-Methode zahlreiche Teil- und Komplettse- 
quenzen des HCV kloniert und charakterisiert. Ein Vergleich dieser Sequenzen zeigt eine hohe Variabilitat des viralen 

60 Genoms, insbesondere im Bereich des NS5B-Gens, was letztendlich zu einer Einteilung in 6 Genotypen gefuhrt hat, die 
selbst nochmals in Subtypen a, b, und c untergliedert sind. Die genomische Varianz ist nicht gleichmafiig uber das Ge- 
nom vcrteilt. So sind die 5'NTR und Teilc der 3'N'I'R hoch konscrvicri, wahrend bestimmte kodicrende Sequenzen z. T. 
sehr stark variieren, vor allem die Hullproteine El und E2. 
Die klonierten und charakterisierten Teil- und Komplettsequenzen des HCV-Genoms wurden auBerdem hinsichtlich 

65 geeigneter Angriffsziele fur ein prospektives antivirales Therapeutikum untersucht. Dabei wurden drei virale Enzyme 
gefunden, die sich als solches Angriffsziel anbieten. Diese sind (1) der NS3/4A Proteasekornplex, (2) die NS3 Helikase 
und (3) die NS5B RNA-abhangige RNA Polymerase. Der NS3/4A Proteasekornplex und die NS3 Helikase konntcn bc- 
reits kristallisiert und hinsichtlich ihrer dreidimensionalen Struktur aufgeklart werden (Kim et al., 1996, Cell, 87,343; 
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Yem et al., 1998, Protein Science, 7, 837; Love et al., 1996, Cell, 87, 311; Kim et al. f 1998, Structure, 6, 89; Yao et al, 
1997, Nature Structural Biology, 4, 463, Cho et al., 1998, J. Biol. Chem., 273, 15045); bei dcr NS5B RNA-abhangigen 
RNA Polymerase ist dies bis heute noch nicht gelungen. 

Obwohl mit diesen Enzymen bedeutsame AngrifFsziele fur eine Therapieentwicklung der chronischen HCV-Infektion 
definiert sind, und obwohl sowohl mit Hilfe von "rational drug design" als auch mit Hilfe von "high throughput screens" 5 
weltweit intensiv nach geeigneten Inhibitoren gesucht wird, leidet die Therapieentwicklung an einem groBen Defizit, 
namlich dem Fehlen von Zellkultursystemen oder einfachen Tiermodellen, die es erlauben, HCV-RNA oder HCV- Anti- 
gene direkt, zuverlassig und mit einfachen laborublichen Methoden nachzuweisen. Das Fehlen solcher Zellkultursy- 
steme ist auch der Hauptgrund dafiir, daB das Verstandnis der HCV-Replikation bis heute noch sehr luckenhaft und in 
weiten Teilen nur hypothetisch ist. io 

Obwohl nach Meinung der Fachwelt eine enge evolutionare Beziehung zwischen HCV und den Flavi- und Pestiviren 
besteht und fur diese autonom replizierende RNAs beschrieben sind, die in verschiedenen Zellinien ohne weiteres zur 
Replikation gebracht werden konnen und dabei relativ hohe Ausbeuten zeigen (siehe Khromykh et al., 1997, J. Virol. 71, 
1497; Behrens et al, 1998, J. Virol. 72, 2364; Moser et al., 1998, J. Virol. 72, 5318), waren ahnliche Versuche mit HCV 
bisher nicht erfolgreich. 15 

Zwar ist aus verschiedenen Publikationen bekannt, daB Zellinien oder primare Zellkulturen mit HCV-haltigem, hoch- 
titrigem Patientenserum infiziert werden konnen, (Lanford et al. 1994, Virology 202, 606; Shimizu et al. 1993, Proce- 
dings of the National Academy of Sciences, USA, 90, 6037-6041; Mizutani et al. 1996, Journal of Virology, 70, 
7219-7223; M. Ikeda et al. 1998, Virus Res. 56, 157; Fournier et al. 1998, J. Gen. Virol. 79, 2376 und darin zitierte Li- 
teraturstellen, Ito et al. 1996, Journal of General Virology, 77, 1043-1054), diese virusinfizierten Zellinien oder Zellkul- 20 
turen erlauben jedoch nicht den direkten Nachweis von HCV-RNA oder HCV-Antigenen. Die virale RNA in diesen Zel- 
len ist weder in einem Northem-Blot (einem Standardverfahren zum quantitativen Nachweis von RNA) noch sind die vi- 
ralen Protein in einem Western-Blot oder mittels Immunprazipitation detektierbar. Nur mit sehr aufwendigen und indi- 
rekten Methoden ist es uberhaupt gelungen, eine HCV-Replikation nachzuweisen. Diese nachteiligen Umstande zeigen 
klar, daB die Replikation in diesen bekannten virusinfizierten Zellinien oder Zellkulturen absolut unzureichend ist. 25 

Desweiteren ist aus den Publikationen von Yoo et al. (1995, Journal of Virology, 69, 32-38) und von Dash et al., 
(1997, American Journal of Pathology, 151, 363-373) bekannt, daB Hepatomazellinien mit synthetischer HCV-RNA, die 
mittels in vitro Transkription von kloniertem HCV-Genom gewonnen wurde, transfiziert werden konnen. In beiden Pu- 
blikationen gingen die Autoren von dem Grundgedanken aus, daB das virale HCV-Genom eine Plusstrang-RNA ist, die 
nach dem Einschleusen in die Zelle direkt als mRNA fungiert, an die sich Ribosomen anheften und im Zuge von Trans- 30 
lationsprozessen Virusproteine bilden, aus denen sich letztendlich neue HCV-Partikel bilden (konnen). Diese Virusrepli- 
kation, d. h. diese neu gebildeten HCV- Viren bzw. deren RNA wurde mittels RT-PCR nachgewiesen. Die publizierten Er- 
gebnisse der durchgefuhrten RT-PCR sprechen jedoch dafur, daB die Effizienz der HCV-Replikation in den beschriebe- 
nen HCV-transfizierten Hepatomazellen nur sehr gering ist und jedenfalls nicht ausreicht, urn Schwankungen in der Re- 
plikationsrate nach gezielter Einwirkung mit prospektiven antiviralen Therapeutika auch nur qualitati v, geschweige denn 35 
quantitativ zu messen. 

Aufgabe der vorliegenden Erfindung ist die Bereitstellung cincs HCV-Zellkultursystems, bei dem die virale RNA in 
den transfizierten Zellen autonom und mit so hoher Effizienz repliziert, daB Schwankungen in der Replikationsrate nach 
gezielter Einwirkung mit virus- und insbesondere HCV-spezifischen prospektiven antiviralen Therapeutika qualitati v 
und quantitativ und mit Hilfe gangiger, laborublicher MeBverfahren gemessen werden konnen. 40 

Eine Losung dieser Aufgabe besteht in der Bereitstellung eines Zeilkultursystems der eingangs genannten Art, bei 
dem die cukaryontischcn Zclien humane Hepatomazellen sind, die vorzugswcisc von einer handelsublichcn Hcpatoma- 
zellinie abstammen, aber auch aus einer entsprechenden Primarzellkultur gewonnen sein konnen, und bei dem das ein- 
geschleuste HCV-spezifische Genmaterial ein HCV-RNA-Konstrukt ist, das die HCV-spezifischen RNA-Abschnitte 
5"N"1"R, NS3, NS4A, NS4B, NS5A, NS5B und 3'NTR, vorzugswcisc in dcr genannten Rcihcnfolgc, und zudcm wcnig- 45 
stens ein selektierbares Markergen (Selektionsgen) umfaBl. 

"NTR" stent hier und im folgenden fur "nicht translatierte Region" und ist dem einschlagigen Fachmann als Begriff 
bzw. Abkiirzung bekannt und gelaufig. 

Der Begriff "HCV-RNA-Konstrukt" umfaBt hier und im folgenden sowohl Konstrukte, die das komplette HCV-Ge- 
nom en thai ten, als auch solche, die lediglich einen Teil da von, d. h. ein HCV-Subgenom enthalten. 50 

Eine bevorzugte Variante des erfindungsgemaBen Zeilkultursystems, die sich in der Praxis sehr gut bewahrt hat, tragi 
ist unter der Nummer DSM ACC2394 (Laborbezeichnung HuBl 9-13) bei der DSMZ, Deutsche Sammlung von Mi- 
kroorganismen und Zellkulturen GmbH in Braunschweig, Deutschland, hinterlegt. 

Mit dem erfindungsgemaBen Zcllkultursystcm wird erstmals ein in-vitro-Systcm bcrcit gcstcllt, in dem HCV-RNA in- 
trazellular, autonom und in ausreichend groBen Mengen repliziert und exprimiert wird, so daB eine quantitati ve Beslim- 55 
mung sowohl der HCV-RNA-Mengen als auch der HCV-spezifischen Proteine mit konventionellen und zuverlassig ge- 
nauen biochcmischen McBmcthodcn durchgcfuhrt werden kann. Das hciBt: es stcht erstmals ein annahcrnd authentisches 
zellgesiutztes ("cell-based") HCV-RepIikationssystem zur Verfugung, das fur die Entwicklung und Erprobung von anti- 
viralen Pharmazeutika dringend benotigt wird. Dieses Testsystem bietet nun die Moglichkeit, potentielle Angriffsziele 
ftir eine wirksame HCV-spezifische Therapie zu identifizieren und HCV-spezifische Chemotherapeutika zu entwickeln 60 
und zu evaluieren. 

Die Erfindung basicrt auf der uberraschenden Erkcnntnis, daB cine effizicntc Replikation der HCV-RNA nur dann in 
Zellen stattfindet, wenn diese mit einem HCV-RNA-Konstrukt transfiziert wurden, das mindestens die 5' und die 3' nicht- 
translatierten Regionen (NTR) und die Nichtstrukturproteine (NS) 3 bis 5B umfaBt und zusatzlich ein selektierbares 
Markergen (Selektionsgen) aufweist. Offensichtlich sind die Strukturgene fiir den Ablauf der Replikation ohne wesent- 65 
liche Bedeutung, wiihrend andererseits eine effiziente Replikation der HCV-RNA anscheinend nur dann staltfindet, wenn 
die transfizierten Zellen einem pcrmanentcn Sclektionsdruck unterzogen werden, der durch das mit dcr HCV-RNA vcr- 
bundene selektierbare Markergen (Selektionsgen) vermittelt wird. Das Markergen (Selektionsgen) scheint sornit einer- 
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seits die Selektion derjenigen Zellen zu provozieren, in denen die HCV-RNA produktiv repliziert, und andererseils 
scheint es die Effizienz der RNA-Rcplikation wesentlich zu steigern. 

Gegenstand der Erfindung ist auch ein zellfreies HCV-RNA- Konstrukt, das sich dadurch auszeichnet, daB es die HCV- 
spezifischen RNA-Abschnitte 5TSfTR, NS3, NS4A, NS4B, NS5A, NS5B und 3OTR, vorzugsweise in der genannten Rei- 
5 henfolge, und zudem ein selektierbares Markergen (Selektionsgen) umfaBt. 

Der Begriff 5WR bzw. NS3 bzw. NS4A bzw. NS4B bzw. NS5A bzw. NS5B bzw. 3TMTR umfaBt im vorliegenden Zu- 
sammenhang jede Nukleotidsequenz, die im Stand der Technik als Nukleotidsequenz fur den jeweils betreffenden funk- 
tionellen Abschnitt des HCV-Genoms beschrieben ist. 

Die Bereitstellung eines solchen HCV-RNA-Konstrukts ermoglicht erstmals eine detaillierte Analyse der HCV-Repli- 
10 kation, -Pathogenesis und -Evolution in Zellkulturen. Die HCV-spezifische virale RNA kann - als vollstandiges Genorn 
oder als Subgenom - gezielt in beliebigen Mengen erzeugt werden, und es besteht die Moglichkeit, das RNA-Konstrukt 
zu manipulieren und damit die HCV-Funktionen auf genetischer Ebene zu untersuchen und aufzuklaren. 

Da alle zur Zeit als HauptangrirTszicl fur eine Therapic untersuchten HC V- Enzyme, namlich die NS3/4A Protease, die 
NS3 Helikase und die NS5B Polymerase, in dem erfindungsgemaBen HCV-RNA- Konstrukt enthalten sind, kann es fur 
15 alle entsprechenden Untersuchungen benutzt werden. 

Eine Ausfiihrungsform des HCV-RNA-Konstrukts, die sich in der praktischen Anwendung sehr gut bewahrt hat, 
zeichnet sich dadurch aus, daB sie die Nukleotidsequenz gemaB Sequenzprotokoll SEQ ID NO: 1 umfaBt. 

Weitere Ausfuhrungsvarianten mit vergleichbar guten Eigenschaften fiir den Einsatz in der Praxis sind dadurch ge- 
kennzeichnet, daB sie eine Nukleotidsequenz entweder gemaB Sequenzprotokoll SEQ ID NO: 2 oder gemaB Sequenz- 
20 protokoll SEQ ID NO: 3 oder gemaB Sequenzprotokoll SEQ ID NO: 4 oder gemaB Sequenzprotokoll SEQ ID NO: 5 
umfassen. 

Es besteht die Moglichkeit, das erfindungsgemaBe HCV-Subgenom-Konstrukt mit einer 3'NTR zu versehen, die eine 
im Stand der Technik hierfur bisher unbekannle Nukleotidsequenz aufweist, namlich eine Nukleotidsequenz, die aus der 
Gruppe der nachfolgend aufgelisteten Nukleotidsequenzen (a) bis (i) ausgewahlt. ist: 

25 (a) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTTTTTTTA 
GCTTTTTTTTTTTTCTTTTTTTTTGAGAGAGAGAGTCTCACTCTGTTGCCC 
AGACTGGAGT 

30 

(b) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTTAGTCT TTTTTTTTTC TTTTTTTTGA GAGAGAGAGT CTCACTCTGT 
TGCCCAGACT GGAGC 

35 

(c) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTAATCTTT TTTTTTTTCT TTTTTTTTGA GAGAGAGAGT CTCACTCTGT 
TGCCCAGACT GCAGC 

40. 

(d) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTTTAGTC txttTTTTTT TCTTTTTTTT TGAGAGAGAG AGTCTCACTC 
TGTTGCCCAG ACTGGAGT 

45 

(e) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTTAGTCT TTTTTTTTTT TCTTTTTTTT TGAGAGAGAG AGTCTCACTC 

50 TGTTGCCCAG ACTGGAGT 

(f) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTTAGTCT TTTTTTTTTT TCTTTTTTTT TTGAGAGAGA GAGTCTCACT 

55 CTGTTGCCCA GACTGGAGT 
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(g) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTTAGTCT TTTTTTTTTT CTTTTTTTTT GAGAGAGAGA 
GTCTCACTCT GTTGCCCAGA CTGGAGT 

(h) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTTTT AAT CTTTTTTTTT TTTTTCCTTT TTTTGAGAGA 
GAGAGTCTCA CTCTGTTGCC CAGACTGGAG T 



(i) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTTTAATC xtxxxxTTTT TTTTCTTTTT TTTTTGAGAG 

AGAGAGTCTC ACTCTGTTGC CCAGACTGGA GT is 

Das in den erfindungsgemaBen HCV-RNA-Konstrukten enthaltene selektierbare Markergen (Selektionsgen) ist vor- 
zugsweise ein Resistenzgen, insbesondere eine Antibiotikumresistenzgen. 

Das hat den Vorteil, daB die mit diesem Konstrukt transfizierten Zellen leicht von den nicht transfizierten Zellen selek- 
tiert werden konnen, indem dem Zellkulturmedium z. B. im Fall eines Antibiotikumresistenzgens das betreflfende Anti- 20 
biotikum zugegeben wird. Unter "Antibiotikum" wird im vorliegenden Zusammenhang jede Substanz verstanden, die 
die nicht-transfizierten Wirtszellen oder die Snellen, in denen die HCV-RNA nur mit geringer Effizienz rcpliziert, am Le- 
ben oder Wachstum hindert, insbesondere Zellgifte wie z. B. Puromycin, Hygromycin, Zeocin, Bleomycin oder Blasti- 
cidin. 

Ein bevorzugtes selektierbares Markergen (Selektionsgen) bzw. Resistenzgen, das sich in der Praxis sehr gut bewahrt 25 
hat, ist das Neomycinphosphotransferasegen. 

Eine Alternative zu den Antibiotikumresistenzgenen ist z. B. dasThymidin-Kinase-Gen, mit dem eine HAT-Selektion 
durchgefuhrt werden kann. 

Die Position des selektierbaren Markergens (Selektionsgens), bzw. des bevorzugten Resistenzgens bzw. des besonders 
bevorzugten Antibiotikumresistenzgens in dem HCV-RNA-Konstrukt liegt vorzugsweise hinter der HCV 5'NTR, d. h. 30 
strangabwarts der 5'NTR bzw. strangaufwarts des HC V-Leserasters. Denkbar ist aber auch eine Insertion im Bereich der 
3*NTR oder an anderer Stelle des HCV-Genoms oder -Subgenoms, z. B. innerhalb des Polyproteins. 

Bei einer alternativen Ausfuhrungsform des erfindungsgemaBen HCV-RNA-Konstrukts ist das selektierbare Marker- 
gen (Selektionsgen), insbesondere ein Antibiotikumresistenzgen, iiber ein Ribozym bzw. eine Erkennungsstelle fiir ein 
Ribozym mit der HCV-RNA bzw. der HCV-Genom- oder -Subgenomsequenz verbunden. 35 

Damit geht der Vorteil einher, daB nach erfolgter Selektion derjenigen Zellen, in denen die HCV-RNA produktiv re- 
pliziert, in den daraus gewonnenen Zcllkloncn das Resistenzgen durch ribozymvermittelte Spaltung von der HCV-Sub- 
genomsequenz abgetrennt werden kann, namlich durch Aktivierung des einklonierten Ribozyms oder, im Fall eines Kon- 
strukts mit einer Erkennungsstelle fur ein Ribozym, durch Einschleusen des Ribozyms in die Zellen (z. B. mittels Trans- 
fekuon eines Ribozymkonstrukts oder Infektion mit einem viralen Expressionsvektor, in den das entsprechende Ribo- 40 
zym eingeselzt wurde). Auf diese Weise wird ein authentisches HCV-Genom-Konstrukt ohne Resistenzgen erhalten, das 
zur Bildung authcntischcr infcktioser Viruspartikcl bcfahigt ist. 

Eine weitere bevorzugte Ausfuhrungsform des erfindungsgemaBen HCV-RNA-Konstrukts zeichnet sich dadurch aus, 
daB das Konstrukt wenigstens ein integriertes Reportergen aufweist. 

Unter Reportergen wird im folgcndcn jedes Gen verstanden, dessen Anwcscnhcit sich nach Ubcrfuhrung in cincn Zicl- 45 
organismus leicht und im allgemeinen mit einfachen biochemischen oder auch histochemischen Melhoden nachweisen 
laBt, d. h. das fur ein Protein kodiert, welches auch in geringen Mengen einfach und zuverlassig mit den laboriiblichen 
MeBmethoden nachgewiesen und quantifiziert werden kann. 

Diese Variante des HCV-RNA-Konstrukts hat den Vorteil, daB der Umfang der Replikation dieses Konstrukts anhand 
des Reportergenprodukts einfach und schnell mit laboriiblichen Melhoden gemessen werden kann. 50 

Das Reportergen ist vorzugsweise ein Gen aus der Gruppe der Luziferasegene, dem CAT-Gen (Chloramphenicol- Ace- 
tyl-Transferase-Gen), dem lacZ-Gen (beta-Galaktosidasegen), dem GFP-Gen (green-fluorescence-protein-Gen), dem 
GUS-Gen (Glukuronidasegen) oder dem SEAP-Gen (Sezernerte-Alkalische-Phosphatase-Gen). Diese Reportergene 
bzw. dercn Produktc, namlich die cntsprcchcndcn Rcportcrprotcinc, konnen z. B. mittels Fluorcszcnz, Chcmilumincs- 
zenz, colorimelrisch oder mit Hilfe immunologischer Methoden (z. B. ELISA) bestimmt werden. 55 

Als Reportergen kommt aber auch ein Surrogatmarkergen in Betracht. Darunter sind in diesem Zusammenhang solche 
Gene zu verstchen, die fur zcllulare Protcinc, Nuklcinsaurcn oder - allgcmcin - fiir solche Funktioncn kodicrcn, die einer 
von der Virusreplikation abhangigen Variation unterliegen, und die infolgedessen in denjenigen Zellen, in denen sich das 
HCV bzw. das HCV-RNA-Konstrukt vermehrt, entweder reprimiert oder aktiviert werden. Das heiBt: die Reduktion bzw. 
Aktivierung dieser Funktion ist ein Ersatzmarker fiir die Virusreplikation bzw. die Replikation des HCV-RNA-Kon- 60 
strukts. 

Die Positioncn von Reportergen und sclckticrbarem Markergen (Selektionsgen) konnen so gewahlt scin, daB cin aus 
den beiden Genprodukten gebildetes Fusionsprotein exprimiert wird. Hierbei besteht die vorteilhafte Moglichkeit, daB 
diese beiden Gene so in dem HCV-RNA-Konstrukt angeordnet sind, daB ihre beiden exprimierten Proteine zunachst iiber 
eine Schnittstelle fiir eine Protease (z. B. Ubiquitin) oder iiber ein selbstspaltendes Peptid (z. B. das 2A-Protein der Pi- 65 
cornaviren) fusioniert sind und erst spater proteolytisch wieder getrennt werden. 

Ebcnsogut konnen diese beiden Positioncn aber auch derart getrennt voncinander licgen, daB bcidc Gen produktc sc- 
parat exprimiert werden. (z. B. in der Reihenfolge: Marker- bzw. Resistenzgen - interne Ribosomenbindungsstelle - Re- 
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portergen). 

Im Fall des Reportergens hat sich einc Ausfuhrungsvariantc besondcrs bcwahrt, bei der das Rcportcrgcn in das offene 
Leseraster des HCV-Genoms oder -Subgenoms einkloniert isl, und zwar derart, daB es erst nach einer proteolytischen 
Prozessierung in eine aktive Form uberfuhrt wird. 
5 Das erfindungsgemaBe Zellkultursystem in alien seinen Variationen kann fur vielfaltige Zwecke eingesetzt werden. 
Diese umfassen: 

- Das Auffinden antiviral wirksamer Substanzen. Dies kbnnen beispielsweise sein:* organische Verbindungen, die 
uninittelbar oder mittelbar in die Virus vermehrung eingreifen (z. B. Inhibitoren der viralen Proteasen, der NS3-He- 

10 likase, der NS5B RNA-abhangigen RNA Polymerase), antisense Oligonukleotide, die an eine beliebige Zielse- 

quenz innerhalb des HCV-RNA-Konstrukts (z. B. die 5'NTR) hybridisieren und unmittelbar oder mittelbar zu einer 
Beeinflussung der Virus vermehrung fiihren z. B. auf Grund einer Reduktion der Translation des HCV-Polyproteins 
oder Ribozyme, die eine beliebige HCV-RNA-Sequenz spalten und damit die Virusreplikation beeintrachtigen. 

- Die Evaluierung jeglicher Art antiviral wirksamer Substanzen in Zellkultur. Solche Substanzen konnen beispiels- 
15 weise mittels "rational drug design" oder "high-throughput screening" am isolierten gereinigten Enzym gefunden 

werden. Unter Evaluierung sind vor allem die Bestimmung der inhibitorischen Eigenschaften der entsprechenden 
Substanz sowie deren Wirkungsmechanismus zu verstehen. 

- Die Identifikation neuer Angriffsziele, viralen oder zeliularen Ursprungs, fur eine HCV-spezifische antivirale 
Therapie. 1st beispielsweise ein zellulares Protein esscntiell fur die Virusreplikation, kann mittels Hemmung dieses 

20 zeliularen Proteins die Virusreplikation ebenfalls beeinfluBt werden. Das Auffinden solcher auxiliaren Faktoren ist 

mit dem erfindungsgemaBen System ebenfalls moglich. 

- Der Einsatz fur die Resistenzbestimmung. Es ist anzunehmen, daB auf Grund der hohen Mutationsrate des HCV- 
Genoms Therapieresistenzen auftreten. Solche Resistenzen, die gerade bei der klinischen Zulassung einer Substanz 
von groBer Bedeutung sind, lassen sich mit dem erfindungsgemaBen Zellkultursystem ermitteln. Zellinien in denen 

25 sich das HCV-RNA-Konstrukt bzw. das HCV-Genom oder -Subgenom repliziert, werden mit steigenden Konzen- 

trationen der entsprechenden Substanz inkubiert und die Replikation der viralen RNA wird entweder anhand eines 
eingebrachten Reporters oder durch qualitative oder quantitative Bestimmung der viralen Nukleinsauren oder Pro- 
teine bestimmt. Resistenz ist dann gegeben, wenn bei normaler Wirkstoffkonzentration keine Hemmung der Repli- 
kation zu beobachten ist. Durch Reklonierung der HCV-RNA (z. B. mittels RT-PCR) und Sequenzanalyse konnen 

30 die fur Therapieresistenz verantwortlichen Nukleotid- bzw. Aminosaureaustauschc ermittelt werden. Durch Einklo- 
nieren der/des entsprechenden Austausches in das Ursprungskonstrukt kann deren Kausalitat fur die Therapieresi- 
stenz bewiesen werden. 

- Die Produktion authentischer Virusproteine (Antigene) fiir die Entwicklung und/oder Evaluierung von Diagno- 
stika. Das erfindungsgemaBe Zellkultursystem erlaubt auch die Expression von HCV-Antigenen in Zellkulturen. 

35 Diese Antigene konnen prinzipiell auch fur den Aufbau diagnosu'scher Nachweisverfahren eingesetzt werden. 

Das erfindungsgemaBe HCV-RNA-Konstrukt fiir sich genommen kann in alien seinen Variationen ebenfalls fur viel- 
faltige Zwecke eingesetzt werden. Dazu gehoren vor allem: 

40 - Die Konstruktion attenuierter Hepatitis C Viren bzw. HCV-ahnlicher Partikel und deren Produktion in Zellkultu- 

ren: 

Durch zufallige oder gezielt hcrvorgcrufcnc Mutationcn, beispielsweise Punktmutationcn, Dclctionen oder Insertio- 
nen, konnen attenuierte HCV- oder HCVahnliche Partikel erzeugt werden, d. h. Viren bzw. virusahnliche Partikel 
mit voller Replikationskompetenz aber verringerter bzw. fehlender Pathogenitat. Solche attenuierte HCV- oder 
45 HCV-ahnlichc Partikel sind insbesonderc als Impfstoff cinsctzbar. 

- Die Konstruktion von HCV-RNA-Konstruklen mit integrierten Fremdgenen, beispielsweise zur Verwendung als 
leberzellspezifische Genfahren in der Gentherapie. Auf Grund des ausgepragten Leberzelltropismus des HCV und 
der Moglichkeit, Teile des Genoms durch heterologe Sequenzen zu ersetzen, lassen sich HCV-RNA-Konstrukte 
herstellen, bei denen beispielsweise die Struklurproleine durch ein therapeutisch wirksames Gen ersetzl werden. 

50 Das so erhaltene HCV-RNA-Konstrukt wird in Zellen eingeschleust, vorzugsweise mittels Transfektion, die die 

fehlenden HCV-Funktionen, beispielsweise die Strukturproteine, konstitutiv oder induzierbar exprimieren. Durch 
diese dem Fachmann unter dem BegrilTder "Transkomplemeniation" bekannte Technik lassen sich Viruspartikel er- 
zeugen, in die das HCV-RNA-Konstrukt eingebaut wird. Die so erhaltenen Partikel kbnnen fiir die Infektion vor- 
zugsweise von Lcbcrzellcn verwendet werden. In dicscn wird das therapeutisch wirksamc Frcmdgcn zur Expression 

55 gebracht und entfaltet damit seine therapeutische Wirkung. 

- Das Auffinden permissiver Zellen, d. h. Zellen, in denen eine produktive Virus vermehrung erfolgt. Zu diesem 
Zwcck wird entweder cincs der vorgenanntcn HCV-RNA-Genomkonstruktc verwendet, das zur Bildung komplctter 
infektibser Viren befahigt ist, oder es wird eines der vorgenannten HCV-Subgenom-Konslrukte eingesetzt, das al- 
lerdings zunachst gemaB vorgenanntem Beispiel in eine Zellinie transfiziert wird, die die fehlenden Funktionen 

60 konstitutiv oder induzierbar exprimierl. In all diesen Fallen entstehen Viruspartikel, die zusatzlich zur HCV-Se- 
quenz ein Resistenz- und/oder Reportergen tragen. Zurn Auffinden von Zellen, in denen das HCV replizieren kann, 
werden diese Zellen mit den so hcrgcstclltcn Viren infizicrt und einer Antibiotikumsclcktion untcrzogen oder, in 
Abhangigkeit vom HCV-RNA-Konstrukt, mittels Nachweis der Expression des Reportergens untersucht. Da eine 
Antibiotikumresistenz bzw. eine Expression des Reportergens nur dann nachweisbar ist, wenn das HCV-RNA-Kon- 

65 strukt repliziert, miissen die so gefundenen Zellen permissiv sein. Auf diese Weise lassen sich nahezu beliebige Zel- 
linien oder primare Zellkulturen hinsichtlich der Permissivilat testen und auffinden. 

Die Erfindung wird im folgenden anhand von Ausfuhrungsbeispieten und dazugehbrigen Figuren naher erlautert. Es 
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zeigen 

Fig. 1A die Struktur eines erfindungsgemaBen HCV-RNA-Konstrukts Ganz oben ist cine schematischc Darstellung 
der Struktur des kompletten parentalen HCV-Genoms gegeben mit den Posilionen der Gene flir die Spaltungsprodukte 
core, El, E2, p7, NS2, NS3, NS4A, NS4B, NS5A und NS5B innerhalb des Polyproteins, und den 5' und 3' nichttransla- 
tierten Regionen (5OTR und 3'NTR) - als Horizontalbalken dargestellt -, und mit den beiden fur die Erzeugung der Sub- 5 
genom-Konstrukte ausgewahlten Positionen, namlich der Position der "GDD-katalytischen Domane" der NS5B RNA 
Polymerase (GDD) und der Position der 3'Grenze der HCV-IRES (Nukleotidpositionen 1 bis 377 bzw. 1 bis 389) - ober- 
halb des Genomschemas eingezeichnet -. Die Zahlen unterhalb des Genomschemas bezeichnen die entsprechcndcn Nu- 
kleotidpositionen. 

Darunter sind schematische Darstellungen der Strukturen zweier erfindungsgemaBer, modifizierter HCV-RNA-Kon- 10 
strukte (Subgenom) gezeigt, bestehend aus der 5'HCV-IRES, dem Neomycinphosphotransferasegen (Neo R ), der EMCV- 
ERES (E-I) und den HCV Sequenzen von NS2 bzw. NS3 bis zum authentischen 3 r Ende. Die Position der das NS5B Po- 
lymerase GDD-Motiv umfassenden 10 Aminosauren-Delction ist jeweils mit einem Dreicck ( A) markiert; 

Fig. IB das Ergebnis einer denaturierenden Formaldehyd-Agarose-Gelelektrophorese zum Nachweis von replizierter 
Plusstrang-RNA in transfizierten subpassagierten Huh-7 Zellklonen. 15 
Die Positionen der HCV-spezifischen RNAs (Pfeile) und der 28S rRNA sind rechts von Spur 12 angegeben, die GroBen 
(Anzahlen der Nukleotide) der RNA-Marker (M) sind links von Spur 1 angegeben; 

Fig. 1C das Ergebnis eines PCR-Tests mit nachfolgendem Southern-Blot zum Nachweis der Abwesenheit von inte- 
grierter Replikon-DNA in den meisten der selekticrten Zellklone. 

Spuren 1 und 2 zeigen die Positivkontrollen, Spur 13 die Negativ-Kontrolle. Die Zahlenangaben links der Spur 1 be- 20 
zeichnen die GroBe der Nukleotid-Marker-Molekiile; 

Fig. 2A das Ergebnis eines PCR-Tests mit nachfolgendem Southern-Blot zum sensitiven AusschluB integrierter Repli- 
kon-DNA (Plasmid Molekule I 37 7/NS3-37wt) in einem HCV-RNA-Konstrukt-haltigen Zellklon (9-13). 
Die Spuren 7 bis 1 1 reprasemieren das Ergebnis einer Titration von DNA-Molekulen des Konstrukts I 3 77/NS3-37wt ohne 
Zugabc von Gesamt-DNA des Zellklons 9- 1 3 und die Spuren 2-6 reprasentieren die gleichen Plasmidmolekiile mit Zug- 25 
abe von jeweils 1 ug 9-13 DNA vor der PGR (zwecks AusschluB eines Inhibitors derPCRinderDNA-Praparation). Spur 
13 reprasentiert die Negativ-Kontrolle (PGR ohne DNA-Sonde). Spur 1 zeigt das Ergebnis, das mit einem ug Gesamt- 
DNA des Zellkons 9-13 erhalten wurde; 

Fig. 2B das Ergebnis eines Northem-Blot-Tests zur Quantifizierung von HCV Plus- und Minusstrang RNA. 
Die Pfeile markieren die Positionen von Replikon-RNA. 30 
Die "plus"- und " minus "-Abgaben bezeichnen die positive (plus) bzw. negative (minus) Polaritat der RNA-Kontrollen, 
die auf das Gel aufgelragen wurden. "Minusstrand" und "Plusstrand" bezeichnen die Spezifilat der radioaktiven RNA- 
Sonden; 

Fig. 2C Ergebnis einer Formaldehyd-Agarose-Gelelektrophorese nach radioakti ver Markierung der intrazellular repli- 
zierien HCV-RNA zum Nachweis der Resistenz der HCV-RNA-Replikation gegen Dactinomycin; 35 

Fig. 3A Nachweis von HCV-spezifischen Antigenen in den selektierten Zellklonen mittels Immunoprazipilation nach 
metabolischer Radioaktivmarkierung. 

Die Spuren 7-9 reprasentieren authentische GroBenmarker (die nach transienter Expression eines HCV-RNA-Konstrukts 
in Huh-7-Zellen erhalten wurden); identifizierte HCV-Proteine sind am linken Rand von Spur 1 markiert, die Molekular- 
gewichte (in Kilodalton) sind am rechten Rand von Spur 9 angegeben; 40 

Fig. 3B Ergebnisse eines Immunfluoreszenztests zum Nachweis der subzellularen Lokalisation von HCV Antigenen; 

Fig. 4 schematischc Darstellung der Struktur eines erfindungsgemaBen selekticrbarcn HCV-RNA-Konstrukts (kom- 
plettes Genom) bestehend aus der 5'HCV-IRES, dem Neomycinphosphotransferasegen (NeoR), einem heterologen 
IRES-Element, z. B. des Encephalomyocarditisvirus (E-I), dem vollstandigen HCV-Leseraster und der authentischen 
3'NTR; " 45 

Fig. 5 schematische Darstellung der Struktur von HCV-RNA-Konstruklen nut insertierlem Antibiotikumresislenzgen 
(A) innerhalb der fiir das Polyprotein kodierenden Nukleotidsequenz (monocistronische RNA), und (B) innerhalb der 
3'NTR (bicistronische RNA); 

Fig. 6 schematische Darstellung der Struktur von HCV-RNA-Konstrukten mit insertiertem Reporlergen (A) als Teil 
eines HCV-Replikons von NS3 bis NS5B; - das Reporterprotein wird letztendlich durch virale oder durch zellulare Pro- 50 
teasen aus dem Polyprotein gespalten und das selektierbare Markergen (Selektionsgen) bzw. das Resistenzgen durch 
Kontransfeklion in die Zellen einschleust, (B) als Teil eines Fusionsgens aus Resistenz- und Reportergen (z. B. fiir die 
Neomycinphosphotransferase und green fluorescent Protein) (C) als Teil eines Replikons aus Resistenz- und Reportergen 
(z. B. fiir die Neomycinphosphotransferase und das green fluorescent Protein), die iibcr cine Nukleotidsequenz vcrbun- 
den sind, welche fur eine Aminosauresequenz kodierl (schraffierter Bereich), die von einer Protease gespalten werden 55 
kann oder die uber eine selbstspaltende (aulokatalytische) Aktivitat verfugt, (A) als unabhangiges Gen (hier green fluo- 
rescent protein), das von einer cigenen intcrncn Ribosomcnbindungsstellc (IRES) aus cxprimicrt wird; - das Resistenz- 
gen (hier: Neomycinphosphotransferase-Gen) wird davon unabhangig ebenfalls von einer eigenen internen Ribosomen- 
bindungsstelle (IRES) aus exprimiert (polycistronisches Konstrukt); 

Fig. 7 schematische Darstellung der Struktur eines HCV-RNA-Konstrukts bei dem das Resistenzgen uber ein Ribo- 60 
zyin bzw. eine Erkennungsstelle fiir ein Ribozym mit der HCV-RNA-Sequenz verbunden ist. 

Die dicken Linicn stcllcn die HCV 5'- und 3'NTRs dar, E-l ist eine hetcrologe interne Ribosomcnbindungsstellc, die fur 
die Expression des Resistenzgens notwendig ist, und das graue Quadrat stellt das Ribozym bzw. eine Erkennungsstelle 
fiir ein Ribozym dar; 

Fig. 8 schematische Darstellung der Struktur eines HCV-RNA-Konstrukts mil Resistenzgen und integriertem Fremd- 65 
gen. 
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Beispiel 1 

Herstellung von HCV-RNA-Konstrukten 

5 (A) Synthcse und Klonierung eines vollstandigcn HCV-Konsensusgenoms mitteis RT-PCR 

Aus der Leber eines chronisch infizierten Patienten wurde das HCV-Genom, d. h. die HCV- RNA wie nachfolgend be- 
schrieben isoliert: 

Aus ca. 100 mg Leber wurde die komplette RNA gemafi dem Verfahren von Chomczynski und Sacci (1987, Anal. 

10 Biochem. 162, 156) isoliert. Mit 1 ug dieser isolierten RNA wurde eine reverse Transkription mit den Primern A6103. 
(GCTATCAGCCGGTTCATCCACTGC) oder A9413 (CAGGATGGCCTATTGG CCTGGAG) und dem "expand re- 
verse transcriptase "-System (Boehringer Mannheim, Deutschland) nach den Vorschriften des Herstellers durchgefuhrt, 
Mit den Produkten dieser reversen Transkription (RT) wurde eine Polymerase- Kettenreaktion (PCR = polymerase chain 
reaction) durchgefuhrt, und zwar unter Verwendung des "expand long template"- Systems (Boehringer Mannheim, 

15 Deutschland), wobei der Puffer mit 2% Dimethylsulfoxid-Gehalt eingesetzt wurde. Nach einer Stunde bei 42°C wurde 
1/8 dieses Reaktionsansatzes in einem crsten PCR-Durchgang mit den Primern A6103 und S59 (TGTCTTCACGCA- 
GAAAGCGTCTAG) oder A9413 und 54542 (GATCAGCT CGCCGCGAAGCTGTCC) eingesetzt. Nach 40 Zyklen 
wurde 1/10 dieses Reaktionsansatzes in einem zweiten PCR-Durchgang mit den Primern S59 und A4919 (AGCA- 
CAGCCCGCGTCATAGCACTCG) oder 54542 und A9386 (TTAGCTCCCCG TTCATCGGTTGG) eingesetzt. Nach 

20 30 Zyklen wurden die PCR-Produkte mitteis praparativer Agarose-Gel-Elektrophorese gereinigt und die dabei eluierten 
Fragmente wurden in den VektorpCR2.1 (Invitrogen) oder pBSK II (Stratagene) ligiert. Vier Klone von jedem Fragment 
wurden analysiert und sequenziert, und es wurde eine Konsensus-Sequenz ermittelt. Zu diesem Zweck wurden die DNA- 
Sequenzen miteinander verglichen. Die Positionen, an denen sich die Sequenz eines der Fragmente von den ubrigen un- 
terschied, wurde als unerwiinschte Mutation betrachtet. Ini Fall von Mehrdeutigkeiten der Sequenz wurden kurzere sich 

25 uberlappende PCR-Fragmente der betreffenden Region amplifiziert und mehrere Klone sequenziert. Auf diese Weise 
konnten zahlreiche potentielle Mutationen in jedem Fragment identifiziert und somit eine isolat-spezifische Konsensus- 
sequenz etabliert werden. Diese etablierte Konsensussequenz bzw. dieses Genom gehort zum weltweit verbreiteten Ge- 
notyp lb. Die nicht translatierte Region am 3-Ende (= 3'NTR) wurde mitteis konventioneller PCR erhalten, wobei ein 
Antisense-Primer eingesetzt wurde, der die letzten 24 Nukleotide des im Stand der Technik bekannten "X-tails" (Tanaka 

30 et al., 1995, Biochem. Biophys. Res. Commun. 215, 744; und Rice, PCT/US 96/14033) abdeckt. Die authentischc nicht 
translatierte Region am 5'-Ende (= 5'NrR) strangabwarts vom T7 Promotor wurde mitteis PCR erzeugt, wobei zum ei- 
nen ein Oligonukleotid verwendet wurde, das einem verkiirzten T7 Promotor (TAA TAC GAC TCA CTA TAG) und den 
ersten 88 Nukleotiden von HCV entspricht, und zum anderen eines der vorgenannten Plasmide eingesetzt wurde, das ei- 
nes der 5'Fragmente des Genoms tragt. Aus den subgenomischen Fragmenten mit der geringsten Anzahl an Nicht-Kon- 

35 sensus-Austauschen wurde ein komplettes HCV-Konsensusgenorn zusammengesetzt und in einen modifizierten 
pBR322-Vektor insertiert. Abweichungen von der Konsensussequenz wurden mitteis ortsgerichteter Mutagenese ("site- 
directed mutagenesis") beseitigt. Um "run-off'-Transkripte mit einem authentischen 3'Ende herzustellen, wurde die 
3'NTR der Isolate (mit dem Ende TGT) zu AGT modifiziert (gemaB der Sequenz vom Genotyp 3 = Klon "WS" nach Ko- 
lykhalov et al, 1996, J. Virol. 70, 3363) und auBerdem wurde ein zusatzlicher Nukleotidaustausch an Position 9562 vor- 

40 genommen, um die A:T Basenpaarung in der Haarnadelstruktur am 3'Ende der 3'NTR (Kolyhalov et al. ibid.) beizube- 
halten. Um eine interne Restriktionsstelle fur das Enzym Seal zu beseitigen, wurde ferner ein sog. stiller ("silent") Nu- 
kleotidaustausch vorgenommen. Nach dem Zusammcnfugcn des Vollangcn-Genoms mit passenden 5'- und 3'NTRen 
wurde die komplette HCV-Sequenz uberpruft. Dabei wurde kein ungewunschter Nukleotidaustausch gefunden. 
Das auf diese Weise hergestellte HCV-Genom sollte per Definition hepatotrop sein. 

45 

(B) Synthese selektierbarer HCV-Subgenorn-Konstrukte 

Unter Verwendung des unter (A) beschriebenen Konsensusgenoms wurden HCV-Subgenorn-Konstrukte hergestellt, 
die das Antibiotikumresislenzgen Neomycin-Phosphotransferase (NPT) und zwei Sequenzen von internen Ribosomen- 

50 bindungsstellen (IRES) enthalten. Die hierfur angewendeten biochemischen Verfahrenstechniken sind dem Fachmann 
bekannt und gelaufig (siehe: Sambrook, J., E. F. Fritsch, T. Maniatis, 1989, Molecularcloning: a laboratory manual, 2nd 
ed„ Cold Spring Harbour Laboratory, Cold Spring Harbor, N. Y.; Ausubel et al. (eds.), 1994, Current Protocols in Mole- 
cular Biology, Vol. 1-3, John Wiley & Sons Inc., New York). Das Antibiotikumresistenzgen wurde unmittelbar hinter der 
5'NrR insertiert, wodurch cine bicistronischc RNA erhalten wurde (siehe Fig. 1A). Ebcnsogut kann das Antibiotikum- 

55 resistenzgen aber auch an anderer Stelle des HCV-Subgenom-Konstrukts insertiert werden, beispiels weise innerhalb der 
fur das Polyprotein kodierenden Nukleotidsequenz, wodurch eine monocistronische RNA erhalten wird (siehe Fig. 5A) 
oder in die 3'NTR (siehe Fig. 5B). Bei den IRES-Elcmcnten handclt cs sich zum einen um cine der beiden HCV-JRES- 
Varianten Nukleotide 1-377 oder Nukleotide 1-389, und zum anderen um die IRES des Enzephalomyocardilis Virus, die 
die Translation der HCV Sequenz strangabwarts von den Genen fur NS2 oder NS3 bis zu dem authentischen 3'Ende des 

60 Genoms steuert. 

Die beiden genannten HCV-IRES-Varianten wurden wie folgt ermittelt: 
Auf der Basis von Deletionsanalyscn der 3'Grcnzc der HCV-fRES (Reynolds et al. 1995, EMBO J. 14, 6010) wurden 
verschiedene Abschnitte der 5'NIR mit dem NPT Gen fusioniert und anhand von Kotransfektionen mit einem das '17 
RNA Polymerase Gen enthaltenden Plasmid hinsichtlich der maximalen Anzahl gebildeter Kolonien analysiert. Die be- 

65 sten Ergebnisse wurden mit den HCV Sequenzen von 1-377 und 1-389 erhalten. Da sich das AUG-Startkodon des HCV 
Polyproteins an Position 342 befindet und somit in der IRES-Sequenz enthalten ist, kommt es zu einer Fusion von 12 
bzw. 16 Aminosaurcn des HCV-Kapsidprotcins ("Core-Proteins") mit der Neomycin Phosphotransferase (siehe Fig. 1 A). 
Diese modifizierten HCV-Subgenorn-Konstrukte erhielten dementsprechend die Bezeichnungen I 3 77/NS2-3' (oder 
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I 377 /NS3-3') und I 389 /NS2-3' (oder I 3 89/NS3-3'). Sie sind in Fig. 1A schematisch dargestellt. 

Mit in-vitro-Transkripten dieser modifiziertcn parentalen HCV-Subgenom-Konstrukte I 3 77/NS2-3' (oder I 3 g9/NS3-3) 
und I 389 /NS2-3' (oder I389/NS3-3') wurden verschiedene Zellinien und Prirnarzellkulturen von menschlichen Hepalocy- 
ten transfiziert. 

Als parallele Negativ-Kontrolle zu alien TVansfeklionsexperimenten wurde zu jedern modifizierten parentalen HCV- 5 
Subgenom-Konstrukt ein entsprechend modifiziertes aber defektes Subgenom konstruiert, das sich von dem parentalen 
dadurch unterscheidet, daB es innerhalb des Leserasters eine Deletion von 10 Aminosauren aufweist, die das aktive Zen- 
trum der NS5B RNA Polymerase umfaBt (Behrens et al., 1996, EMBO J. 15, 12; und Lohmann et al., 19977 Virol. 71, 
8416). 

10 

(C) Synthese selektierbarer HCV-Genom-Konstrukte 

Ein NS2-3'Subgenomkonstrukt, das am 5'Ende mit einem Fragment des Luziferasegcns und der vollstandigen EMCV- 
IRES verbunden ist, wurde mitNcol und Spel restringiert und mittels praparativer Agarosegelelektrophorese gereinigt. 
Der so erhaltene Vektor wurde in einer 3-Faktor Ligation mil einem NcoI/Notl-HCV-Fragment, entsprechend den Nu- 15 
kleotidpositionen 342 bis 1968 des HCV-Genoms und mit einem Notl/Spel-Fragment, entsprechend den Nukleotidposi- 
tionen 1968-9605 Hgiert. Das entstandene Konstrukt, bei dem das vollstandige HCV-Leseraster und die stromab- 
warts dem Luziferasegenfragment und der EMCV-IRES liegen, wurde danach mit Pmel und Spel restringiert und mit 
dem analog restringierten I 389 /NS3-37wt-Subgenomkonstrukt- Vektor ligiert. Dieses selektionierbare HCV-Genomkon- 
strukt ist in Fig. 4 dargestellt. 20 

(D) Herstellung von den HCV-RNA-Konstrukten entsprechenden in-vitro-Transkripten 

Die vorstehend beschriebenen gereinigten Plasmid DNAs wurden mit Seal linearisiert und nach Phenol/Chloroform- 
Extraktion und Isopropanol-Prazipitation in eine In-vitro-Transkriptionsreaktion eingesetzt unter Verwendung der fol- 25 
genden Komponenten: 80 nuM HEPES, pH 7,5, 12,5 mM MgCl 2 , 2 mM Spermidin, 40 mM Dithiothreitol, 2 mM von je- 
dern NTP, 1 Einheit RNasin/ul, 50 ug/ml restringierte DNA und ca. 2 Einheiten/ul T7 RNA Polymerase. Nach 2 Std. bei 
37°C wurde die Halfte der Menge an T7 Polymerase zugegeben und der Reaktionsansatz weitere 2 h inkubiert. Zur Ent- 
femung von DNA wurde die Mischung mit saurem Phenol extrahiert (U. Kedzierski, J. C. Porte, 1991, Bio Techniques 
1 0, 210), mit Isopropanol prazipitiert, das Pellet in Wasser gelost und mit DNase (2 Einheiten pro ug DNA) fur 60 Min. 30 
bei 37°C inkubiert. Nach anschlieBender Extraktion mit saurem Phenol, saurem Phenol/Chloroform und Chloroform und 
Isopropanol-Prazipitation wurde die geloste RNA mittel opuscher Dichtemessungen quantifiziert und ihre Unversehrt- 
heit mittels Formaldehyd-Agarose-Gelelektrophorese uberpruft. 

Beispiel 2 35 

Transfektionsexperimente mit der Hepatomazellinie Huh-7 

Bei samtlichen Transfektionsexperimenten wurde sorgfaltig darauf geachtet, daB jegliche Matrizen-DNA zuvor ent- 
fernt worden war, urn zu vermeiden, daB solche DNA in transfizierte Zellen integrieren und diesen unabhangig von einer 40 
HCV-Replikation eine Neomycin-Resistenz vennitteln konnte. Deshalb wurde im AnschluB an die in-vitro-Transkrip- 
tion (Beispiel ID) die Rcaktionsmischung mit 2 Einheiten DNase pro ug DNA fiir 60 Min. bei 37°C bchandclt und mit 
saurem Phenol, saurem Phenol/Chloroform und Chloroform extrahiert. Vor der Verwendung fur die Transfektion wurde 
die prazipitierte RNA mittels Formaldehyd Agarose Gel Elektrophorese analysiert. 

Es wurden drci separate Transfektionsexperimente mit der hoch diffcrcnzicrtcn humancn Hepatomazellinie Huh-7 45 
(gemaB Nakabayashi et al. 1982, Cancer Res. 42, 3858) durchgefuhrl. Dabei wurde jeweils 15 ug RNA in 8 X 10 6 IIuh-7- 
Zellen mit Hilfe der Elektroporation eingebracht und diese Zellen anschlieBend in Kulturschalen von 10 cm Durchmes- 
ser ausgesat. 24 Stunden nach der Aussaat wurde Neomycin (= G418) in einer Endkonzentration von 1 mg/ml zugege- 
ben. Das Kulturmedium wurde zweimal pro Woche gewechselt. Nach 3-5 Wochen waren kleine Kolonien erkennbar, die 
isoliert und unter den gleichen Kulturbedingungen passagiert wurden. 50 

Die Zellklone, die im Verlauf des ersten Experiments erhalten wurden, wurden isoliert und subpassagiert. Wahrend 
dieser Prozedur starben die meisten Klone und die Endausbeute betrug nur noch 9 Klone von Zellen, die mit den paren- 
talen HCV-Subgenom-Konstrukten transfiziert worden waren und 1 Klon (Klone 8-1) von Zellen, die mit einem defekten 
HCV-Gcnom-Konstrukt, namlich einer defekten NS2-3'HCV-RNA transfiziert worden waren. AuBer einer vcrkurztcn 
Verdopplungszeit und dem gelegentlichen Auftreten von irregular geformten Zellen wurden keine beslandigen morpho- 55 
logischen Unterschiede zwischen diesen 9 Zellklonen und dem einen Zellklon (Klon 8- 1) oder den parentalen Huh-7 Zel- 
len gefunden. 

Die Hauptkriterien fur funktionierende HCV-Genomkonstrukte sind die Bildung von viraler RNA mit korrekter GroBe 
und die Abwesenheit von (integrierter) Plasmid DNA, die eine G418-Resistenz iibertxagen bzw. vennitteln konnte. 

Urn die HCV-RNA in den Huh-7-Zellen zu bestimmen, wurde die Gesamt-RNA isoliert und mittels des gangigen 60 
Northern-Blot Verfahrens unter Verwendung einer Plusstrang-spezifischen Ribosonde (= RNA-Sonde) analysiert. Hier- 
fiir wurde von den jcweiligen Zellklonen Gesamt-RNA nach der Methodc von Chomczynski und Sacchi 1987, Anal. 
Biochem. 162, 156 isoliert, und 10 ug RNA, was dem Gesamt-RNA-Gehalt von 0,5-1 x lCr Zellen entspricht, mittels de- 
naturierender Formaldehyd- Agarose- Gelelektrophorese aufgetrennt (Spuren 3 bis 12 der Fig. IB). Als GroBenmarker 
mit authentischer Sequenz wurden gleichzeitig 109 in-vitro-Transkripte (ivtr.), die zu den I 3 g 9 /NS2-3Vwt oder den 65 
I 389 /NS3-37wt Replikon-RNAs korrespondieren, mit aufgetrennt (Spur 1 bzw. Spur 2). Die aufgetrennte RNA wurde auf 
Nylon-Mcmbrancn transfcriert und mit radioaktiv markicrtcr Plusstrang-spczifischcr RNA-Sonde, die kornplcmcntar zu 
dem kompletten NPT-Gen und der HCV- IRES von Nukleotid 377 bis Nukleotid 1 war, hybridisiert. Die Positionen der 
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HCV-spezifischen RNAs (Pfeile) und der 28S rRNA sind rechts von Spur 12 angegeben, die GroBen (Anzahlen der Nu- 
kleotidc) der RNA-Marker sind links von Spur 1 angegeben. Die RNA Marker-Fragmente enlhalten HGV-Sequenzcn 
und hybridisieren deshalb mil der Ribosonde (= RNA-Sonde). Die Ergebnisse dieser Analyse sind in Fig. IB dargestellt. 
Mil Ausnahme des mit dem defekten HCV-Genom-Konstrukt transfizierten Klons 8-1, lieferten alle Zellklone homo- 
5 gene HCV-RNAs korrekter Lange (ca. 8640 Nukleoiide irn Fall des NS2-3' und ca. 7970 Nukleolide im Fall des NS3- 
3*Replikons). Dieser Befund ist ein Indiz dafiir, daB die funktionalen Replikons bzw. die funktionalen HGV-Genom-Kon- 
strukte die G418 Resistenz ubertragen. Um auszuschlieBen, daB die G418 Resistenz auf eine Plasmid-DNA zuriickzu- 
fuhren ist, die in das Genom der Huh-7 Wirtszelle integriert ist und unter der Kontrolle eines zellularen Promotors tran- 
skribiert wird, wurde von jedem Klon die DNA mittels einer NPT-Gen-spezifischen PGR uniersucht. Hierbei wurde aus 

10 den selektierten Huh-7-Zellklonen die DNA mittels Verdau mit Proteinase K (40 ug/ml, 1 h, 37°C) in 10 mM Tris, 
pH 7,5, 1 mM EDTA, 0,5% SDS und anschlieBender Extraktion mit Phenol, Phenol/Chloroform- und Isopropanolprazi- 
pitation isoliert. Das DNA-Prazipitat wurde in 10 mM Tris (pH 7,5) und 1 mM EDTA geldst und 1 Stunde mit Rnase A 
inkubiert. Im AnschluB an eine Phenol/Ghloroform Extraktion und Ethanol Prazipitation wurde 1 ug DNA, entsprechend 
4-8 x 10 4 Zellen, mittels PGR unter Einsatz NPT-Gen-spezifischer Primer (5-TGAAGAGGGAGGTG TGGGGTGGCG- 

15 3' und 5'-GTrGAGGGTGGGGAAGAGTTGGGG-3) analysiert und ein DNA-Fragment bestehend aus 379 Nukleotiden 
erzeugt. Die Spezifitat des PGR-Produkts wurde mittels Southern Blot Verfahren nachgewiesen, wobei ein Digoxigenin- 
markiertes DNA Fragment eingesetzt wurde, das zu dem NPT-Gen korrespondiert. Als Positiv-Kontrollen (zum Nach- 
weis etwa vorhandener kontaminierender Nukleinsauren) wurde das PGR- Verfahren mit 10 7 Plasmid Molekiilen oder 
1 ug DNA aus einer BHK Zellinie, die stabil mit einem Neomycin-Resistenz-Gen transfiziert war, durchgefuhrt, und als 

20 Negativ- Kontrolle wurde die PGR mit denselben Reagenzien aber ohne zugesetzte DNA durchgefuhrt. 

Die Ergebnisse dieser Untersuchung sind in Fig. 1G dargestellt. Die Spuren 1 und 2 reprasentieren die Positiv-Kon- 
trollen, Spur 13 reprasentiert die Negativ-Kontrolle. Die Zahlenangaben links der Spur 1 bezeichnen die GroBe der Nu- 
kleotid-Marker-Molekiile. AuBer in Klon 7-3 (Fig. 1G, Spur 3), der von Zellen nach Transfektion mit einem NS2-3'-Re- 
plikon/NS2-3'HGV-Genom-Konstrukt stammt, und in Klon 8-1 (Fig. 1G, Spur 12), der von Zellen nach Transfektion mit 

25 einem defekten HGV-Genom-Konstrukt stammt, war in keinem Zellklon eine NPT-DNA nachweisbar. Dieser Befund ist 
ein weiteres Indiz dafur, daB die G418 Resistenz der meisten Klone durch die replizierende HGV-RNA vermittelt wurde. 
Aber auch unabhangig von diesen Ergebnissen ist es unwahrscheinlich, daB HGV-RNAs mit korrekter GroBe von inte- 
grierter Plasmid DNA erzeugt wird, denn die fur die in-vitro-Transkription verwendeten Plasmide enthalten weder einen 
eukaryontischen Promotor noch ein Polyadenylierungssignal. Im Fall des Klons 7-3 ist die Resistenz deshalb hochst 

30 wahrscheinlich sowohl durch das HGV-RNA- Konstrukt bzw. die replizierende HGV-RNA als auch durch eine integrierte 
NPT-DNA Sequenz vermittelt worden, wahrend die Resistenz der Zellen von Klon 8-1 ausschlieBlich auf die integrierte 
Plasmid DNA zuruckzufuhren ist. 

Um zu bestatigen, daB die G418 Resistenz von einer autonom replizierenden HGV-RNA vermittelt ist, wurde der Klon 
9-13 (Fig. IB, Spur 11) weiteren Tests unterworfen. Klon 8-1, der integrierte Kopien des NPT-Gens tragt, wurde uberall 

35 als Negativkontrolle eingesetzt. Mit dem Ziel, die Anwesenheit von NPT-DNA im Klon 9-13 rigoros auszuschlieBen, 
wurde eine PGR durchgefuhrt, die den Nachweis von < 1000 NPT-Gen-Kopien in 40.000 Zellen erlaubt. Das Ergebnis 
dieser PGR ist in Fig. 2A dargestellt. Im einzclncn wurde bei dieser PGR wie folgt verfahren: 

Es wurden jeweils lOMO Plasmid Molekiile (I 3 77/NS3-3'/wt) entweder direkt (Spuren 7-11) oder nach Zugabe von 
jeweils 1 ug 9-13 DNA (Spuren 2-6) in dem Test eingesetzt. Die Spezifitat der amplifizierten DNA Fragment wurde mit- 

40 tels Southern Blot unter Verwendung einer NPT-spezifischen Sonde bestimmt. Eine PGR ohne DNA-Sonde wurde als 
Negativ-Kontrolle durchgefuhrt (Spur 12). 

Sclbst mit dieser sensitiven Methode wurde in einem ug DNA des Zcllklons 9-13 kcinc Plasmid DNA gefunden (Spur 
1). Um die Menge an HGV Plus- und Minusstrang RNAs in diesen Zellen abzuschatzen, wurde eine Verdtinnungsreihe 
von Gesamt-RNA mit dem Northern-Blot- Verfahren unter Verwendung einer Plus- oder Minusstrang-spezifischen radio- 

45 aktiv markicrtcn Ribosonde (= RNA-Sonde) analysiert. Hicrfur wurden jeweils 8, 4 oder 2 ug Gesamt-RNA, die aus den 
Zellklonen 9-13 und 8-1 isoliert worden waren, parallel zu bekannten Mengen analoger in- vitro- Thinskripte mit Plus- 
oder Minusstrang-Polaritat (Kontroll-RNAs) im Northern-Blot- Verfahren analysiert und anschlieBend einer Hybridisie- 
rung unterworfen. Die Hybridisierung wurde mit einer Plusstrang-spezifischen Ribosonde, die das komplette NPT-Gen 
und die HGV- IRES abdeckte ("plusstrand", obere Bildtafel), oder mil einer Minusstrang-spezifischen RNA-Sonde, die 

50 zu der NS3-Sequenz komplementar war ("minusstrand", untere Bildtafel) durchgefuhrt. Die Pfeile markieren die Posi- 
tionen von Replikon-RNA. Die Ergebnisse dieser Analyse sind in Fig. 2B dargestellt. 

Im Fall des Plusstrangs wurden ca. 10 8 Kopien/ug Gesaml-RNA nachgewiesen, was 1000-5000 HGV-RNA-Moleku- 
len pro Zelle entspricht, wahrend die Menge an Minusstrang-RNA 5- bis 10-fach niedriger war. Dieses Ergebnis stimmt 
mit der Annahmc ubcrein, daB die Minusstrang RNA die rcplikativc Zwischcnform bzw. Zwischcnkopic ist, die als Vor- 

55 lage fur die Synthese der Plusstrang Molekiile dient. 

Da die Reaktion im wesentlichen von der viralen RNA-ahhangigen RNA Polymerase katalysiert wird, sollte die Syn- 
these der HGV-RNAs rcsistcnt gegen Dactinomycin scin, einem Antibiotikum, das sclcktiv die RNA-Synthcse von 
DNA-Matrizen inhibierl, nicht jedoch die RNA-Synlhese von RNA-Matrizen. Um diese Vennutung zu bestatigen, wur- 
den Zellen mit [ 3 H] Uridin in Anwesenheit von Dactinomycin inkubiert, die radioaktiv markierten RNAs extrahiert, mit- 

60 tels denaturierender Agarose-Gel-Elektrophorese aufgetrennt und mit Hilfe eines handelsublichen Bio-Imagers unter 
Verwendung einer f 3 H]-sensitiven Bildplatte analysiert. Hierfiir wurden jeweils ca. 5 x 10 5 Zellen der Klone 9-13 und 8- 
1 mit 100 u Gi l 3 HJUridin fiir 16 Std. in Abwcscnheit (-) oder Gcgcnwart (+) von 4 ug/ml Dactinomycin (Dact) inku- 
biert. Im AnschluB an diese Markierungsreaktion wurde die Gesamt-RNA prapariert und mittels Formaldehyd- Agarose- 
Gel-Elektrophorese analysiert. In den beiden ersten Spuren ist nur 1/10 der Gesamt-RNA dargestellt. Die radioaktiv mar- 

65 kierte RNA wurden mit einem BAS-2500 Bio-Imager (Firma Fuji) sichtbar gemacht. 

Die Ergebnisse dieser Analyse sind in Fig. 2G dargestellt. In Ubereinstinunung mil dem Inhibitor- Profil der NS5B Po- 
lymerase (Behrcns et al., 1996, EMBOJ. 15, 12 und Lohmann ct al., 1997, J. Virol. 71, 8416) war die Rcplikadon der 
HGV-RNA nicht durch Dactinomycin beeinfluBt worden, wahrend die Synthese von zellularer RNA gehemmt worden 
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war. Um die Identitat der viralen RNA zu bestatigen, wurde eine RT-PCR zur Reklonierung der replizierten Sequenzen 
durchgefuhrt. Die Scquenzanalysc der reklonierten RNA zeigte, daB die RNA in dem Klon 9-13 HCV-spezifisch ist und 
mil dem transfizierten Transkript des HCV-Konstrukls I 37 7/NS3-3'/wt ubereinstimmt. 

Zur Analyse der viralen Proteine wurden die betreffenden Zellen zunachst metabolisch mit [ 35 S] Methionin/Cystein 
radioaktiv markiert, anschlieBend lysiert und danach die HCV-spezifischen Proteine mittels Immunoprazipitation aus 5 
den Zell-Lysaten isoliert. Die Ergebnisse dieser Analysen sind in Fig. 3 A dargestellt. Im einzelnen wurde dabei wie folgt 
verfahren: Zellen der Zellklone 9-13 (wt) und 8- 1 ( A ) waren durch Behandlung fur 1 6 Stunden mit einer dem Fachmann 
gelaufigen und im Handel erhaltlichen Protein-Markicrungs-Mischung (z. B. NEN Life Science) metabolisch radioaktiv 
markiert worden. Mittels Immunoprazipitation (IP) unter nichtdenaturierenden Bedingungen (z. B. nach Bartenschlager 
et al., 1995,.l Virol. 69, 7519) und unter Verwendung von drei verschiedenen Antiseren (3/4, 5A, 5B, gemaB Markierung to 
am oberen Ende der Spuren 1 bis 12) waren die HCV-spezifischen Proteine vom Zell-Lysat abgetrennt worden. Die Im- 
munokomplexe wurden mittels Tricine SDS-PAGE analysiert und mittels Autoradiographic sichtbar gemacht. Um au- 
thentische GroBenmarker zu erhalten, wurde das homologe Replikonkonstrukt I 3 77/NS3-3'/wt einer transienten Expres- 
sion mit dem Vaccinia Virus T7-Hybrid System in Huh-7 Zellen unterworfen. Die dabei erhaltenen Produkte waren als 
GroBenmarker (Spuren 7-9) parallel zu den Zellen der Klone 9-13 und 8-1 behandelt worden. Identifizierte HCV-Pro- 15 
teine sind am linken Rand von Spur 1 markiert, die Molekulargewichte (in Kilodalton) sind am rechten Rand von Spur 9 
angegeben. Es ist anzumerken, daB das verwendeteNS3/4-spezifische Antiserum ("3/4") bevorzugt mit NS4A und NS4B 
reagiert, was zu einer Unterreprasentation von NS3 fuhrt. 

Alle viralen Antigene waren eindeutig nachweisbar und ihre apparenten Molekulargewichte zeigten keine Abwei- 
chungen gegenuber denjenigen, die nach transienter Expression desselben bicistronischen HCV-RNA-Konstrukts in den 20 
ursprunglichen Huh-7 Zellen ermittelt wurden. Um die subzellulare Verteilung der viralen Antigene zu bestimmen, 
wurde eine Immunofluoreszenz-Nachweisreaktion unter Einsatz von NS3- und NS5A-spezifischen Antiseren durchge- 
fuhrt (z. B. nach Bartenschlager et al., 1995, J. Virol 69, 7519). Hierfur wurden Zellen der Klone 9-13 (wt) und 8-1 (A ) 
24 Std. nach dem Aussaen auf Deckglasern mit Methanol/Azeton fixiert und mit polyklonalen NS3- oder NS5A-spezifi- 
schen Antiseren inkubiert. Die gebundenen Antikbrper wurden mit einem kommerziell erhaltlichen FTTC-konjugierten 25 
Anti-Kaninchen- Antiserum sichtbar gemacht. Zur Unterdruckung unspezifischer Fluoreszenzsignale wurden die Zellen 
mit dem Farbstoff "Evans Blue" gegengefarbt. 

Die Ergebnisse dieses Nachweistests sind in Fig. 3 B dargestellt. Mit beiden Antiseren war eine starke Fluoreszenz im 
Zytoplasma nachweisbar. Die NS5A-spezifischen Antiseren fuhrten auBerdem zu einer schwachen Zellkern-Fluores- 
zenz, was darauf hindeutet, daB zumindest kleine Mengen dieses Antigens auch zum Zellkern gelangen. Die generell do- 30 
minierende Prasenz der viralen Antigene im Zytoplasma ist jedoch ein starkes Indiz dafiir, daB die HCV-RNA Replika- 
tion im Zytoplasma stattfindet - so wie das bei den meisten RNA- Viren der Fall ist. 

Diese Ergebnisse belegen klar, daB mit dem hier beschriebenen Versuchsansatz der Aufbau eines Zellkultursystems 
fiir das HCV gelungen ist, dessen Effizienz alles bisher bekannte um GrbBenordnungen ubersteigt und erstmalig den 
Nachweis viraler Nukleinsauren und Proteine mit konventionellen und bewahrten biochemischen Methoden erlaubt. Erst 35 
diese Effizienz erlaubt iiberhaupt detaillierte Untersuchungen der HCV-Pathogenese, genetische Analysen verschiedener 
HCV-Funktionen und ein genaues Studium der Virus-/Wirtszcllwechsclwirkungcn, wodurch sich neue Ansatzpunkte fiir 
die Entwicklung einer antiviralen Therapie definieren lassen. 

Beispiel 3 40 

Transfektion von Huh-7 Zellen mit HCV-Genomkonstrukten 

Huh-7 Zellen werden wie in Beispiel 2 beschrieben transfiziert und selektioniert, wobei hier jedoch selektionierbare 
Konstruktc verwendet werden, die das vollstandigc Virusgcnom enthaltcn. Die erhaltenen Zellklone werden analog dem 45 
Beispiel 2 mittels PGR auf Abwesenheit von HGV-DNA untersucht und die produktive Replikation der HCV-RNA wird 
danach mittels Northern Blot, [ 3 H]Uridinmarkiening in Anwesenheit von Dactinomycin, Nachweis der viralen Proteine 
bzw. Antigene vorzugsweise mit Hilfe des Western Blots, der Immunoprazipitation oder der Immunfluoreszenz nachge- 
wiesen. Im Gegensatz zu den im Beispiel 2 beschriebenen Ansatzen lassen sich mit dem hier beschriebenen Konstrukt 
auBerdem vollstandige und sehr wahrscheinlich infektiose Viren erhalten, was bei den dort (in Beispiel 2) beschriebenen 50 
Subgenomkonstrukten nicht der Fall ist. Diese Viren, die in der Zelle und dem Zellkulturiiberstand vorhanden sind, wer- 
den beispielsweise mittels Ultrazentrifugation, Immunprazipitation oder Fallung mit Polyethylenglykol konzentriert und 
alle exogenen, d. h. nicht im Viruspartikel eingebauten Nukleinsauren werden mittels Inkubation mit Nukleasen (RNase, 
DNase, Mikrococusnukleasc) vcrdaut. Auf diese Wcisc lassen sich alle kontaminicrenden Nukleinsauren, die nicht im 
schulzenden Viruspartikel enthalten sind, entfernen. Die geschiitzte virale RNA wird nach Inaklivierung der Nukleasen. 55 
beispielsweise mittels Inkubation mit Proteinase K in einem SDS-haltigen Puffer durch Extraktion mit Phenol und Phe- 
nol/Chloroform isoliert und mittels Northern Blot oder RT-PCR unter Verwendung HCV-spczifischcr Primer nachgewie- 
sen. Auch in diesem Versuchsansatz ist die Kombination des beschriebenen HCV-Konsensusgenoms mil einem Selekti- 
onsmarker entscheidend fur die effiziente Produktion von viraler RNA, viralem Protein und damit von HCV-Partikeln. 

60 

Beispiel 4 

Herstellung und Anwendung eines HCV-RNA Konstrukts, bei dem das Resistenzgen uber ein Ribozym bzw. eine Erken- 
nungsstelle fiir ein Ribozym mit der HCV-Subgenom-Sequenz verbunden ist 

65 

Es wird ein HCV-RNA-Konstrukt gemaB Beispiel 1 oder Beispiel 3 hergestellt, bei dem ein Antibiotikumresistenzgen 
iibcr ein Ribozym bzw. eine Erkcnnungsstcllc fiir ein Ribozym mit der HCV-RNA-Scqucnz verbunden ist. Solchc Kon- 
strukte sind in Fig. 7 schematisch dargestellt. Huh-7 Zellen werden wie in Beispiel 2 beschrieben mit diesem HCV-RNA - 
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Konstrukt transfiziert. Nach der Transfektion in die Zellen erfolgt zunachst die Selektion mil dem entsprechenden Anti- 
biotikum. In den dabei erhaltenen Zctlkloncn wird das cinklonierte Ribozym aktiviert oder, im Fall eines Konstrukts, das 
eine Erkennungsstelle fiir ein Ribozym tragi, wird das Ribozym in die Zelle eingeschleust (z. B. mittels Transfektion ei- 
nes Ribozymkonstrukts oder Infektion mit einem viralen Expressionsvektor, in den das entsprechende Ribozym einge- 
5 setzt wurde). In beiden Fallen wird durch die ribozymvermittelte Spaltung das Resistenzgen von der HCV-RNA-Sequenz 
abgetrennt. Das Ergebnis isl im Fall des HCV-Genom-Konslrukts ein authentisches HC V-Genom ohne Resistenzgen, das 
zur Bildung authentischer infekuoser Viruspartikel befahigt ist. Im Fall des HCV-Subgenom-Konstrukts entsteht ein 
HCV-Replikon ohne Resistenzgen. 

10 Beispiel 5 

Kotransfektion eines HCV-RNA-Konstrukts mit einem separaten Luziferase-Transfektionskonstrukl 

Es wird ein HCV-RNA-Konstrukt gemaB Beispiel 1(A) oder Beispiel 3 oder Beispiel 4 hergestellt. Parallel dazu wird 

15 ein Transfektionskonstrukt hergestellt, welches das Luziferasegen umfaBt, wobei dieses Luziferasegen vermittels einer 
ersten Nukleotidsequenz, die fur eine HCV-Protease- (z. B. NS3-Protease-)Spaltungsstelle kodiert, mit einer zweiten 
Nukleotidsequenz, die fur ein anderes Protein oder einen Teil eines anderen Proteins kodiert, verbunden ist. HCV-RNA- 
Konstrukt und Transfektionskonstrukt werden in beliebige Wirtszellen, vorzugsweise Hepatomazellen, insbesondere 
Huh-7-Zellen, eingeschleust. Dies kann auf die in Beispiel 2 bcschriebene Art und Weise geschehen. Das Produkt des 

20 modifizierten Luziferasegens ist ein Luziferase-Fusionsprotein, in dem die Luziferase auf Grund der Fusion mil dem 
Fremdanteil inaktiv ist. In transfizierten Zellen mit hoher HCV-Replikation wird das Fusionsprotein, das ja eine Schnitt- 
stelle fur eine HCV-Protease enthalt, gespalten und damit die aktive Form der Luziferase freigesetzt, die sich durch lu- 
minometrische Messung bestimmen laBt. Wird die Replikation des HCV-RNA-Konstrukts gehemmt, wird das Fusions- 
protein nicht gespalten und keine aktive Luziferase freigesetzt. Infolgedessen ist die quantitative Bestimmung der Luzi- 

25 ferase ein MaB fur die Replikation des HCV-Subgenom-Konstrukts. Anstelle des Luziferasegens kann ebensogut ein an- 
deres Reportergen verwendet werden, das in analoger Weise modifiziert ist, so daB seine Expression von der Virusrepli- 
kation abhangt, obwohl dieses Reportergen nicht Bestandteil des HCV-Subgenom-Konstrukts ist. Es kann auch ein zel- 
iulares Protein, welches durch die HCV-Proteine oder Nukleinsaure inaktiviert oder aktiviert wird, als sogenannter Sur- 
rogatmarker verwendet werden. In diesem Fall ist die Expression bzw. Aktivitat dieses Surrogatmarkers ein MaB fur die 

30 Replikation der viralen DNA. 

Beispiel 6 

Herstellung von HCV-Subgenom-Konstrukten mit integrierten Fremdgenen zur Verwendung als leberzellspezifische 
35 Genfahren fur die Gentherapie 

Dicsc rekombinanten und selektionicrbarcn HCV-Subgenom-Konstrukte werden in trans-komplementiercnde Helfcr- 
zellinien transfiziert, d. h. in Zellinien, die induzierbar oder konstitutiv die fehlenden Funkuonen (beispielsweise die 
Strukturproteine) exprimieren. Zellklone, die ein funktionelles HCV-Subgenom-Konstrukt enthalten, lassen sich durch 

40 entsprechende Selektion etablieren. Die von der Wirtszelle exprimierten Virus-Strukturproteine erlauben die Bildung 
von Viruspartikeln, in die die RNA der HCV-Subgenom-Konstrukte eingeschleust wird. Das Ergebnis sind also virus- 
ahnlichc Partikcl, die ein erfindungsgcmaBcs HCV-Subgcnom-Konstrukt einschlicBlich des einklonierten Fremdgcns 
enthalten und die dieses mittels Infektion auf andere Zellen ubertragen konnen. Ein Beispiel fur ein solches Konstrukt ist 
in Fig. 8 dargestellt. Es besteht auch die Moglichkeit, das hier beschriebene erfindungsgemaBe HCV-Subgenom-Kon- 

45 strukt mit intcgricrtem Fremdgcn direkt als Expressionsvektor cinzusetzen. Dabei wird analog dem vorgcnanntcn Vcr- 
fahren vorgegangen, allerdings mit dem Unterschied, daB Zellinien transfiziert werden, die keine transkomplemeniieren- 
den Faktoren exprimieren. In diesem Fall dient das HCV-Konstrukt also lediglich als Expressionsvektor. 
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SEQUENZPROTOKOLL 

ALLGEMEINE ANGABEN: 

ANMELDER: 

NAME: Universitat Mainz 
STRASSE. ObereZahlbacher Str. 67... 
ORT: Mainz 

BUNDESLAND: Rheinland-PfaJz 
LAND. Deutschland 
POSTLEITZAHL. 55101 

VERTRETER. 

NAME: Dr. Ulrike Rudolph 
STRASSE: In der Schanz 10 
ORT. Schriesheim 

BUNDESLAND: Baden- Wurttemberg 
LAND: Deutschland 
POSTLEITZAHL: 69198 
VERTRETERNUMMER. 246 263 
AKTENZEICHEN: 



TELEKOMMUNKATION: 

TELEFON: 06203-61348 
TELEFAX: 06203-64196 



BEZEICHNUNG DER ERFINDUNG: 

Hepatitis C Virus Zellkultursystem 



ANZAHL DER SEQUENZEN: 5 



COMPUTERLESBARE FASSUNG: 

DATENTRAGER: Diskette 
COMPUTER: PC 
BETRIEBSSYSTEM: MS DOS 
SOFTWARE. Word 6.0 fur windows 95 
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ANGABEN ZU SEQ ID-NO: I : 

SEQUENZCHARAKTERISTIKA: 
LANGE: 1 1076 Basenpaare 
ART: Nukleinsaure 
STRANGFORM: Einzelstrang 
10 TOPOLOGIE: linear 

ART DES MOLEKULS: Genom-RNA 

is HYPOTHETISCH: Nein 

ANTI-SENSE: nein 

20 URSPRUNGLICHE HERKUNFT: 

ORGAN1SMUS: Hepatitis C Virus 
STAMM: Genotyp lb 
ENTWICKLUNGSSTADIUM: — 
ZELLTYP: — 

UNMITTELBARE HERKUNFT: 
3 0 Isolat aus humanen Leberzellen 

MERKMAL: 

NAME/SCHLUSSEL: kodierende Sequenz fur Viruspartikel 
35 LAGE: — 

ERMITTLUNGSMETHODE: . experimentell 



40 



SEQUENZBESCHREffiUNG: SEQ ID-NO: 1 
Im/Core-3'/wt: u 0 76 bp 

GCCAGCCCCC GATTGGGGGC GACACTCCAC CATAGATCAC TCCCCTGTGA 50 

50 

GGAACTACTG TCTTCACGCA GAAAGCGTCT AGCCATGGCG TTAGTATGAG 100 

TGTCGTGCAG CCTCCAGGAC CCCCCCTCCC GGGAGAGCCA TAGTGGTCTG 150 

CGGAACCGGT GAGTACACCG GAATTGCCAG GACGACCGGG TCCTTTCTTG 200 

GATCAACCCG CTCAATGCCT GGAGATTTGG GCGTGCCCCC GCGAGACTGC 250 

60 TAGCCGAGTA GTGTTGGGTC GCGAAAGGCC TTGTGGTACT GCCTGATAGG 300 

GTGCTTGCGA GTGCCCCGGG AGGTCTCGTA GACCGTGCAC CATGAGCACG 350 

AATCCTAAAC CTCAAAGAAA AACCAAACGT AACACCAACG GGCGCGCCAT 400 

65 

GATTGAACAA GATGGATTGC ACGCAGGTTC TCCGGCCGCT TGGGTGGAGA 450 
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GGCTATTCGG CTATGACTGG GCACAACAGA CAATCGGCTG CTCTGATGCC 500 

GCCGTGTTCC GGCTGTCAGC GCAGGGGCGC CCGGTTCTTT TTGTCAAGAC 550 

CGACCTGTCC GGTGCCCTGA ATGAACTGCA GGACGAGGCA GCGCGGCTAT 600 

CGTGGCTGGC CACGACGGGC GTTCCTTGCG CAGCTGTGCT CGACGTTGTC 650 

ACTGAAGCGG GAAGGGACTG GCTGCTATTG GGCGAAGTGC CGGGGCAGGA 700 

TCTCCTGTCA TCTCACCTTG CTCCTGCCGA GAAAGTATCC ATCATGGCTG 750 

ATGCAATGCG GCGGCTGCAT ACGCTTGATC CGGCTACCTG CCCATTCGAC 800 

CACCAAGCGA AACATCGCAT CGAGCGAGCA CGTACTCGGA TGGAAGCCGG 850 

TCTTGTCGAT CAGGATGATC TGGACGAAGA GCATCAGGGG CTCGCGCCAG 900 

CCGAACTGTT CGCCAGGCTC AAGGCGCGCA TGCCCGACGG CGAGGATCTC 950 

GTCGTGACCC ATGGCGATGC CTGCTTGCCG AATATCATGG TGGAAAATGG 1000 

CCGCTTTTCT GGATTCATCG ACTGTGGCCG GCTGGGTGTG GCGGACCGCT 1050 

ATCAGGACAT AGCGTTGGCT ACCCGTGATA TTGCTGAAGA GCTTGGCGGC 1100 

GAATGGGCTG ACCGCTTCCT CGTGCTTTAC GGTATCGCCG CTCCCGATTC 1150 

GCAGCGCATC GCCTTCTATC GCCTTCTTGA CGAGTTCTTC TGAGTTTAAA 1200 

CAGACCACAA CGGTTTCCCT CTAGCGGGAT CAATTCCGCC CCTCTCCCTC 1250 

CCCCCCCCCT AACGTTACTG GCCGAAGCCG CTTGGAATAA GGCCGGTGTG 1300 

CGTTTGTCTA TATGTTATTT TCCACCATAT TGCCGTCTTT TGGCAATGTG 1350 

AGGGCCCGGA AACCTGGCCC TGTCTTCTTG ACGAGCATTC CTAGGGGTCT 1400 

TTCCCCTCTC GCCAAAGGAA TGCAAGGTCT GTTGAATGTC GTGAAGGAAG 1450 

CAGTTCCTCT GGAAGCTTCT TGAAGACAAA CAACGTCTGT AGCGACCCTT 1500 

TGCAGGCAGC GGAACCCCCC ACCTGGCGAC AGGTGCCTCT GCGGCCAAAA 1550 

GCCACGTGTA TAAGATACAC CTGCAAAGGC GGCACAACCC CAGTGCCACG 1600 

TTGTGAGTTG GATAGTTGTG GAAAGAGTCA AATGGCTCTC CTCAAGCGTA 1650 

TTCAACAAGG GGCTGAAGGA TGCCCAGAAG GTACCCCATT GTATGGGATC 1700 

TGATCTGGGG CCTCGGTGCA CATGCTTTAC ATGTGTTTAG TCGAGGTTAA 1750 

AAAACGTCTA GGCCCCCCGA ACC ACGGGGh CGTGGTTTTC CTTTGAAAAA 1800 

CACGATAATA CCATGGGCAC GAATCCTAAA CCTCAAAGAA AAACCAAACG 1850 

TAACACCAAC CGCCGCCCAC AGGACGTCAA GTTCCCGGGC GGTGGTCAGA 1900 

TCGTCGGTGG AGTTTACCTG TTGCCGCGCA GGGGCCCCAG GTTGGGTGTG 1950 
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CGCGCGACTA GGAAGACTTC CGAGCGGTCG CAACCTCGTG GAAGGCGACA 2000 

ACCTATCCCC AAGGCTCGCC AGCCCGAGGG TAGGGCCTGG GCTCAGCCCG 2050 

5 

GGTACCCCTG GCCCCTCTAT GGCAATGAGG GCTTGGGGTG GGCAGGATGG 2100 

CTCCTGTCAC CCCGTGGCTC TCGGCCTAGT TGGGGCCCCA CGGACCCCCG 2150 

10 GCGTAGGTCG CGCAATTTGG GTAAGGTCAT CGATACCCTC ACGTGCGGCT 2200 

TCGCCGATCT CATGGGGTAC ATTCCGCTCG TCGGCGCCCC CCTAGGGGGC 2250 

15 GCTGCCAGGG CCCTGGCGCA TGGCGTCCGG GTTCTGGAGG ACGGCGTGAA 2300 

CTATGCAACA GGGAATCTGC CCGGTTGCTC CTTTTCTATC TTCCTTTTGG 2350 

CTTTGCTGTC CTGTTTGACC ATCCCAGCTT CCGCTTATGA AGTGCGCAAC 2400 

20 

GTATCCGGAG TGTACCATGT CACGAACGAC TGCTCCAACG CAAGCATTGT 2450 

GTATGAGGCA GCGGACATGA TCATGCATAC CCCCGGGTGC GTGCCCTGCG 2500 

25 

TTCGGGAGAA CAACTCCTCC CGCTGCTGGG TAGCGCTCAC TCCCACGCTC 2550 

GCGGCCAGGA ACGCTAGCGT CCCCACTACG ACGATACGAC GCCATGTCGA 2600 

30 TTTGCTCGTT GGGGCGGCTG CTCTCTGCTC CGCTATGTAC GTGGGAGATC 2650 

TCTGCGGATC TGTTTTCCTC GTCGCCCAGC TGTTCACCTT CTCGCCTCGC 2700 

35 CGGCACGAGA CAGTACAGGA CTGCAATTGC TCAATATATC CCGGCCACGT 2750 

GACAGGTCAC CGTATGGCTT GGGATATGAT GATGAACTGG TCACCTACAG 2800 

CAGCCCTAGT GGTATCGCAG TTACTCCGGA TCCCACAAGC TGTCGTGGAT 2850 

40 

ATGGTGGCGG GGGCCCATTG GGGAGTCCTA GCGGGCCTTG CCTACTATTC 2900 

CATGGTGGGG AACTGGGCTA AGGTTCTGAT TGTGATGCTA CTCTTTGCCG 2950 

45 GCGTTGACGG GGGAACCTAT GTGACAGGGG GGACGATGGC CAAAAACACC 3000 

CTCGGGATTA CGTCCCTCTT TTCACCCGGG TCATCCCAGA AAATCCAGCT 3050 

50 TGTAAACACC AACGGCAGCT GGCACATCAA CAGGACTGCC CTGAACTGCA 3100 

ATGACTCCCT CAACACTGGG TTCCTTGCTG CGCTGTTCTA CGTGCACAAG 3150 

55 TTCAACTCAT CTGGATGCCC AGAGCGCATG GCCAGCTGCA GCCCCATCGA 3200 

CGCGTTCGCT CAGGGGTGGG GGCCCATCAC TTACAATGAG TCACACAGCT 3250 

CGGACCAGAG GCCTTATTGT TGGCACTACG CACCCCGGCC GTGCGGTATC 3300 

60 

GTACCCGCGG CGCAGGTGTG TGGTCCAGTG TACTGCTTCA CCCCAAGCCC 3350 

TGTCGTGGTG GGGACGACCG ACCGGTTCGG CGTCCCTACG TACAGTTGGG 3400 

65 GGGAGAATGA GACGGACGTG CTGCTTCTTA ACAACACGCG GCCGCCGCAA 3450 
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GGCAACTGGT TTGGCTGTAC ATGGATGAAT AGCACTGGGT TCACCAAGAC 3500 

GTGCGGGGGC CCCCCGTGTA ACATCGGGGG GATCGGCAAT AAAACCTTGA 3550 

CCTGCCCCAC GGACTGCTTC CGGAAGCACC CCGAGGCCAC TTACACCAAG 3600 

TGTGGTTCGG GGCCTTGGTT GACACCCAGA TGCTTGGTCC ACTACCCATA 3650 

CAGGCTTTGG CACTACCCCT GCACTGTCAA CTTTACCATC TTCAAGGTTA 3700 

GGATGTACGT GGGGGGAGTG GAGCACAGGC TCGAAGCCGC ATGCAATTGG 3750 

ACTCGAGGAG AGCGTTGTAA CCTGGAGGAC AGGGACAGAT CAGAGCTTAG 3800 

CCCGCTGCTG CTGTCTACAA CGGAGTGGCA GGTATTGCCC TGTTCCTTCA 3850 

CCACCCTACC GGCTCTGTCC ACTGGTTTGA TCCATCTCCA TCAGAACGTC 3900 

GTGGACGTAC AATACCTGTA CGGTATAGGG TCGGCGGTTG TCTCCTTTGC 3950 

AATCAAATGG GAGTATGTCC TGTTGCTCTT CCTTCTTCTG GCGGACGCGC 4000 

GCGTCTGTGC CTGCTTGTGG ATGATGCTGC TGATAGCTCA AGCTGAGGCC 4050 

GCCCTAGAGA ACCTGGTGGT CCTCAACGCG GCATCCGTGG CCGGGGCGCA 4100 

TGGCATTCTC TCCTTCCTCG TGTTCTTCTG TGCTGCCTGG TACATCAAGG 4150 

GCAGGCTGGT CCCTGGGGCG GCATATGCCC TCTACGGCGT ATGGCCGCTA 4200 

CTCCTGCTCC TGCTGGCGTT ACCACCACGA GCATACGCCA TGGACCGGGA 4250 

GATGGCAGCA TCGTGCGGAG GCGCGGTTTT CGTAGGTCTG ATACTCTTGA 4300 

CCTTGTCACC GCACTATAAG CTGTTCCTCG CTAGGCTCAT ATGGTGGTTA 4350 

CAATATTTTA TCACCAGGGC CGAGGCACAC TTGCAAGTGT GGATCCCCCC 4400 

CCTCAACGTT CGGGGGGGCC GCGATGCCGT CATCCTCCTC ACGTGCGCGA 4450 

TCCACCCAGA GCTAATCTTT ACCATCACCA AAATCTTGCT CGCCATACTC 4500 

GGTCCACTCA TGGTGCTCCA GGCTGGTATA ACCAAAGTGC CGTACTTCGT 4550 

GCGCGCACAC GGGCTCATTC GTGCATGCAT GCTGGTGCGG AAGGTTGCTG 4600 

GGGGTCATTA TGTCCAAATG GCTCTCATGA AGTTGGCCGC ACTGA'CAGGT 4 650 

ACGTACGTTT ATGACCATCT CACCCCACTG CGGGACTGGG CCCACGCGGG 4700 

CCTACGAGAC CTTGCGGTGG CAGTTGAGCC CGTCGTCTTC TCTGATATGG 4750 

AGACCAAGGT TATCACCTGG GGGGCAGACA CCGCGGCGTG TGGGGACATC 4800 

ATCTTGGGCC TGCCCGTCTC CGCCCGCAGG GGGAGGGAGA TACATCTGGG 4850 

ACCGGCAGAC AGCCTTGAAG GGCAGGGGTG GCGACTCCTC GCGCCTATTA 4900 

CGGCCT ACTC CCAACAGACG CGAGGCCTAC TTGGCTGCAT CATC ACT AGC 4950 
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CTCACAGGCC 


GGGACAGGAA 


CCAGGTCGAG 


GGGGAGGTCC 


AAGTGGTCTC 


5000 




CACCGCAACA 


CAATCTTTCC 


TGGCGACCTG 


CGTCAATGGC 


GTGTGTTGGA 


5050 


5 


CTGTCTATCA 


TGGTGCCGGC 


TCAAAGACCC 


TTGCCGGCCC 


AAAGGGCCCA 


5100 




ATCACCCAAA 


TGTACACCAA 


TGTGGACCAG 


GACCTCGTCG 


GCTGGCAAGC 


5150 


10 


GCCCCCCGGG 


GCGCGTTCCT 


TGACACCATG 


CACCTGCGGC 


AGCTCGGACC 


5200 




TTTACTTGGT 


CACGAGGCAT 


GCCGATGTCA 


TTCCGGTGCG 


CCGGCGGGGC 


5250 


15 


GACAGCAGGG 


GGAGCCTACT 


CTCCCCCAGG 


CCCGTCTCCT 


ACTTGAAGGG 


5300 




CTCTTCGGGC 


GGTCCACTGC 


TCTGCCCCTC 


GGGGCACGCT 


GTGGGCATCT 


5350 


20 


TTCGGGCTGC 


CGTGTGCACC 


CGAGGGGTTG 


CGAAGGCGGT 


GGACTTTGTA 


5400 




CCCGTCGAGT 


CTATGGAAAC 


CACTATGCGG 


TCCCCGGTCT 


TCACGGACAA 


5450 


25 


CTCGTCCCCT 


CCGGCCGTAC 


CGCAGACATT 


CCAGGTGGCC 


CATCTACACG 


5500 


CCCCTACTGG 


TAGCGGCAAG AGCACTAAGG 


TGCCGGCTGC 


GTATGCAGCC 


5550 




CAAGGGTATA AGGTGCTTGT 


CCTGAACCCG 


TCCGTCGCCG 


CCACCCTAGG 


5600 


30 


TTTCGGGGCG TATATGTCTA AGGCACATGG TATCGACCCT AACATCAGAA 


5650 




CCGGGGTAAG 


GACCATCACC 


ACGGGTGCCC 


CCATCACGTA CTCCACCTAT 


5700 


35 


GGCAAGTTTC 


TTGCCGACGG 


TGGTTGCTCT 


GGGGGCGCCT 


ATGACATCAT 


5750 




AATATGTGAT 


GAGTGCCACT 


CAACTGACTC 


GACCACTATC 


CTGGGCATCG 


5800 


40 


GCACAGTCCT 


GGACCAAGCG 


GAGACGGCTG 


GAGCGCGACT 


CGTCGTGCTC 


5850 




GCCACCGCTA 


CGCCTCCGGG 


ATCGGTCACC 


GTGCCACATC 


CAAACATCGA 


5900 




GGAGGTGGCT 


CTGTCCAGCA CTGGAGAAAT 


CCCCTTTTAT 


GGCAAAGCCA 


5950 


45 


TCCCCATCGA 


GACCATCAAG 


GGGGGGJKGGC 


ACCTCATTTT 


CTGCCATTCC 


6000 




AAGAAGAAAT 


GTGATGAGCT 


CGCCGCGAAG 


CTGTCCGGCC 


TCGGACTCAA 


6050 


50 


TGCTGTAGCA 


TATTACCGGG 


GCCTTGATGT 


ATCCGTCATA 


CCAACTAGCG 


6100 




GAGACGTCAT 


TGTCGTAGCA 


ACGGACGCTC 


TAATGACGGG 


CTTTACCGGC 


6150 


55 


GATTTCGACT 


CAGTGATCGA 


CTGCAATACA 


TGTGTCACCC 


AGACAGTCGA 


6200 




CTTCAGCCTG 


GACCCGACCT 


TCACCATTGA 


GACGACGACC 


GTGCCACAAG 


6250 


60 


ACGCGGTGTC 


ACGCTCGCAG 


CGGCGAGGCA 


GGACTGGTAG 


GGGCAGGATG 


6300 


GGCATTTACA GGTTTGTGAC 


TCCAGGAGAA 


CGGCCCTCGG 


GCATGTTCGA 


6350 




TTCCTCGGTT 


CTGTGCGAGT 


GCTATGACGC 


GGGCTGTGCT 


TGGTACGAGC 


6400 


65 


TCACGCCCGC 


CGAGACCTCA GTTAGGTTGC GGGCTTACCT 


AAACACACCA 


6450 
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GGGTTGCCCG TCTGCCAGGA CCATCTGGAG TTCTGGGAGA GCGTCTTTAC 6500 

AGGCCTCACC CACATAGACG CCCATTTCTT GTCCCAGACT AAGCAGGCAG 6550 

GAGACAACTT CCCCTACCTG GTAGCATACC AGGCTACGGT GTGCGCCAGG 6600 

GCTCAGGCTC CACCTCCATC GTGGGACCAA ATGTGGAAGT GTCTCATACG 6650 

GCTAAAGCCT ACGCTGCACG GGCCAACGCC CCTGCTGTAT AGGCTGGGAG 6700 

CCGTTCAAAA CGAGGTTACT ACCACACACC CCATAACCAA ATACATCATG 6750 

GCATGCATGT CGGCTGACCT GGAGGTCGTC ACGAGCACCT GGGTGCTGGT 6800 

AGGCGGAGTC CTAGCAGCTC TGGCCGCGTA TTGCCTGACA ACAGGCAGCG 6850 

TGGTCATTGT GGGCAGGATC ATCTTGTCCG GAAAGCCGGC CATCATTCCC 6900 

GACAGGGAAG TCCTTTACCG GGAGTTCGAT GAGATGGAAG AGTGCGCCTC 6950 

ACACCTCCCT TACATCGAAC AGGGAATGCA GCTCGCCGAA CAATTCAAAC 7000 

AGAAGGCAAT CGGGTTGCTG CAAACAGCCA CCAAGCAAGC GGAGGCTGCT 7050 

GCTCCCGTGG TGGAATCCAA GTGGCGGACC CTCGAAGCCT TCTGGGCGAA 7100 

GCATATGTGG AATTTCATCA GCGGGATACA ATA'JTTAGCA GGCTTGTCCA 7150 

CTCTGCCTGG CAACCCCGCG ATAGCATCAC TGATGGCATT CACAGCCTCT 7200 

ATCACCAGCC .CGCTCACCAC CCAACATACC CTCCTGTTTA ACATCCTGGG 7250 

GGGATGGGTG GCCGCCCAAC TTGCTCCTCC CAGCGCTGCT TCTGCTTTCG 7300 

TAGGCGCCGG CATCGCTGGA GCGGCTGTTG GCAGCATAGG CCTTGGGAAG 7350 

GTGCTTGTGG ATATTTTGGC AGGTTATGGA GCAGGGGTGG CAGGCGCGCT 7400 

CGTGGCCTTT AAGGTCATGA GCGGCGAGAT GCCCTCCACC GAGGACCTGG 7450 

TTAACCTACT CCCTGCTATC CTCTCCCCTG GCGCCCTAGT CGTCGGGGTC 7500 

GTGTGCGCAG CGATACTGCG TCGGCACGTG GGCCCAGGGG AGGGGGCTGT 7550 

GCAGTGGATG AACCGGCTGA TAGCGTTCGC TTCGCGGGGT AACCACGTCT 7600 

CCCCCACGCA CTATGTGCCT GAGAGCGACG CTGCAGCACG TGTCACTCAG 7650 

ATCCTCTCTA GTCTTACCAT CACTCAGCTG CTGAAGAGGC TTCACCAGTG 7700 

GATCAACGAG GACTGCTCCA CGCCATGCTC CGGCTCGTGG CTAAGAGATG 7750 

TTTGGGATTG GATATGCACG GTGTTGACTG ATTTCAAGAC CTGGCTCCAG 7800 

TCCAAGCTCC TGCCGCGATT GCCGGGAGTC CCCTTCTTCT CATGTCAACG 7850 

TGGGTACAAG GGAGTCTGGC GGGGCGACGG CATCATGCAA ACCACCTGCC 7900 

CATGTGGAGC ACAGATCACC GGACATGTGA AAAACGGTTC CATGAGGATC 7950 
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GTGGGGCCTA GGACCTGTAG TAACACGTGG CATGGAACAT TCCCCATTAA 


8000 




CGCGTACACC 


ACGGGCCCCT 


GCACGCCCTC 


CCCGGCGCCA 


AATTATTCTA 


8050 


5 


GGGCGCTGTG 


GCGGGTGGCT 


GCTGAGGAGT 


ACGTGGAGGT 


TACGCGGGTG 


8100 




GGGGATTTCC 


ACTACGTGAC 


GGGCATGACC 


ACTGACAACG 


TAAAGTGCCT 


8150 


in 

IU 


GTGTCAGGTT 


CCGGCCCCCG AATTCTTCAC 


AGAAGTGGAT 


GGGGTGTGGT 


8200 




TGCACAGGTA CGCTCCAGCG 


TGCAAACCCC 


TCCTACGGGA 


GGAGGTPAPA 


8250 


15 


TTCCTGGTCG 


GGCTCAATCA ATACCTGGTT 


GGGTPACAGT 


TCPrATGPGA 
x v_»^orix o^orl 


8300 




GCCCGAACCG 


GACGTAGCAG 


TGCTCACTTC 


CATGCTCACC 


GACCCCTCCC 


8350 


20 


ACATTACGGC 


GGAGACGGCT 


AAGCGTAGGC 


TGGCCAGGGG 


ATCTCCCCCC 


8400 




TCCTTGGCCA 


GCTCATCAGC 


TAGCCAGCTG 


TCTGCGCCTT 


CCTTGAAGGC 


8450 


25 


AACATGCACT 


ACCCGTCATG 


ACTCCCCGGA 


CGCTGACCTC 


ATCGAGGCCA 


8500 


ACCTCCTGTG GCGGCAGGAG ATGGGCGGGA ACATCACCCG CGTGGAGTCA 


8550 




GAAAATAAGG 


TAGTAATTTT 


GGACTCTTTC 


GAGCCGCTCC 


AAGCGGAGGA 


8600 


30 


GGATGAGAGG GAAGTATCCG TTCCGGCGGA GATCCTGCGG AGGTCCAGGA 


8650 




AATTCCCTCG 


AGCGATGCCC 


ATATGGGCAC 


GCCCGGATTA 


CAACCCTCCA 


8700 


35 


CTGTTAGAGT 


CCTGGAAGGA 


CCCGGACTAC 


GTCCCTCCAG 


TGGTACACGG 


8750 




GTGTCCATTG 


CCGCCTGCCA 


AGGCCCCTCC 


GATACCACCT 


CCACGGAGGA 


8800 


40 


AGAGGACGGT 


TGTCCTGTCA GAATCTACCG 


TGTCTTCTGC 


CTTGGCGGAG 


8850 




CTCGCCACAA 


AGACCTTCGG 


CAGCTCCGAA 


TCGTCGGCCG 


TCGACAGCGG 


8900 




CACGGCAACG 


GCCTCTCCTG 


ACCAGCCCTC 


CGACGACGGC 


GACGCGGGAT 


8950 


45 


CCGACGTTGA 


GTCGTACTCC 


TCCATGCCCC 


CCCTTGAGGG 


GGAGCCGGGG 


9000 




GATCCCGATC 


TCAGCGACGG 


GTCTTGGTCT 


ACCGTAAGCG 


AGGAGGCTAG 


9050 


50 


TGAGGACGTC 


GTCTGCTGCT 


CGATGTCCTA 


CACATGGACA GGCGCCCTGA 


9100 




TCACGCCATG 


CGCTGCGGAG 


GAAACCAAGC 


TGCCCATCAA 


TGCACTGAGC 


9150 


55 


AACTCTTTGC 


TCCGTCACCA 


CAACTTGGTC 


TATGCTACAA 


CATCTCGCAG 


9200 




CGCAAGCCTG 


CGGCAGAAGA 


AGGTCACCTT 


TGACAGACTG 


CAGGTCCTGG 


9250 


60 


ACGACCACTA 


CCGGGACGTG 


CTCAAGGAGA 


TGAAGGCGAA 


GGCGTCCACA 


9300 


GTTAAGGCTA 


AACTTCTATC 


CGTGGAGGAA 


GCCTGTAAGC 


TGACGCCCCC 


9350 




ACATTCGGCC 


AGATCTAAAT 


TTGGCTATGG 


GGCAAAGGAC 


GTCCGGAACC 


9400 


65 


TATCCAGCAA GGCCGTTAAC 


CACATCCGCT 


CCGTGTGGAA 


GGACTTGCTG 


9450 
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GAAGACACTG AGACACCAAT TGACACCACC 
TTTCTGCGTC CAACCAGAGA AGGGGGGCCG 
TATTCCCAGA TTTGGGGGTT CGTGTGTGCG 
GTGGTCTCCA CCCTCCCTCA GGCCGTGATG 
ATACTCTCCT GGACAGCGGG TCGAGTTCCT 
AGAAATGCCC TATGGGCTTC GCATATGACA 
GTCACTGAGA ATGACATCCG TGTTGAGGAG 
CTTGGCCCCC GAAGCCAGAC AGGCCATAAG 
ACATCGGGGG CCCCCTGACT AATTCTAAAG 
CGGTGCCGCG CGAGCGGTGT ACTGACGACC 
ATGTTACTTG AAGGCCGCTG CGGCCTGTCG 
GCACGATGCT CGTATGCGGA GACGACCTTG 
GGGACCCAAG AGGACGAGGC GAGCCTACGG 
TAGATACTCT GCCCCCCCTG GGGACCCGCC 
AGTTGATAAC ATCATGCTCC TCCAATGTGT 
GGCAAAAGGG TGTACTATCT CACCCGTGAC 
GGCTGCGTGG GAGACAGCTA GACACACTCC 
ACATCATCAT GTATGCGCCC ACCTTGTGGG 
CATTTCTTCT CCATCCTTCT AGCTCAGGAA 
TTGTCAGATC TACGGGGCCT GTTACTCCAT 
AGATCATTCA ACGACTCCAT GGCCTTAGCG 
TCTCCAGGTG AGATCAATAG GGTGGCTTCA 
ACCGCCCTTG CGAGTCTGGA GACATCGGGC 
TACTGTCCCA GGGGGGGAGG GCTGCCACTT 
TGGGCAGTAA GGACCAAGCT CAAACTCACT 
GTTGGATTTA TCCAGCTGGT TCGTTGCTGG 
ATCACAGCCT GTCTCGTGCC CGACCCCGCT 
CTACTTTCTG TAGGGGTAGG CATCTATCTA 
GAGCTAAACA CTCCAGGCCA ATAGGCCATC 
TTTTCTTTTT y^"j*TTTTXTT 'p^Y'pY^p^'p'p'p 



) 15 178 A 1 

ATCATGGCAA AAAATGAGGT 9500 

CAAGCCAGCT CGCCTTATCG 9550 

AGAAAATGGC CCTTTACGAT 9600 

GGCTCTTCAT ACGGATTCCA 9650 

GGTGAATGCC TGGAAAGCGA 9700 

CCCGCTGTTT TGACTCAACG 9750 

TCAATCTACC AATGTTGTGA 9800 

GTCGCTCACA GAGCGGCTTT 9850 

GGCAGAACTG CGGCTATCGC 9900 

AGCTGCGGTA ATACCCTCAC 9950 

AGCTGCGAAG CTCCAGGACT 10000 

TCGTTATCTG TGAAAGCGCG 10050 

GCCTTCACGG AGGCTATGAC 10100 

CAAACCAGAA TACGACTTGG 10150 

CAGTCGCGCA CGATGCATCT 10200 

CCCACCACCC CCCTTGCGCG 10250 

AGTCAATTCC TGGCTAGGCA 10300 

CAAGGATGAT CCTGATGACT 10350 

CAACTTGAAA AAGCCCTAGA 10400 

TGAGCCACTT GACCTACCTC 10450 

CATTTTCACT CCATAGTTAC 10500 

TGCCTCAGGA AACTTGGGGT 10550 

CAGAAGTGTC CGCGCTAGGC 10600 

GTGGCAAGTA CCTCTTCAAC 10650 

CCAATCCCGG CTGCGTCCCA 10700 

TTACAGCGGG GGAGACATAT 10750 

GGTTCATGTG GTGCCTACTC 10800 

CTCCCCAACC GATGAACGGG 10850 

CTGTTTTTTT CCCTTTTTTT 10900 

TTTTTTTTTC TCCTTTTTTT 10950 
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TTCCTCTTTT TTTCCTTTTC TTTCCTTTGG TGGCTCCATC TTAGCCCTAG 11000 
TCACGGCTAG CTGTGAAAGG TCCGTGAGCC GCTTGACTGC AGAGAGTGCT 11050 

5 

GATACTGGCC TCTCTGCAGA TCAAGT 

10 

15 
20 

25 ' 

30 

35 

40 

45 

50 

55 

60 
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ANGABEN ZU SEQ ID-N0:2 : 

SEQUENZCHARAKTERISTIKA: 
LANGE: 8637 Basenpaare 
ART: Nukleinsaure 
STRANGFORM: Einzelstrang 
TOPOLOGIE: linear 

ART DES MOLEKULS: Subgenom-RNA 

HYPOTHETISCH: Nein 

ANTI-SENSE: nein 

URSPRUNGLICHE HERKUNFT: 

ORGANISMUS: Hepatitis C Virus 
STAMM: Genotyp lb 
ENTWICKLUNGSSTADIUM: — 
ZELLTYP: — 

UNMITTELBARE HERKUNFT: 

Isolat aus humanen Leberzellen 

MERKMAL: 

NAME/SCHLUSSEL: kodierende Sequenz fur Virusproteine 
LAGE: — 

ERMITTLUNGSMETHODE: . experimentell 



SEQUENZBESCHREBUNG: SEQ ED-NO: 2 
I 1 - 317 /NS2-3 l /wt: 8637 bp 

GCCAGCCCCC GATTGGGGGC GACACTCCAC CATAGATCAC TCCCCTGTGA 
GGAACTACTG TCTTCACGCA GAAAGCGTCT AGCCATGGCG TTAGTATGAG 
TGTCGTGCAG CCTCCAGGAC CCCCCCTCCC GGGAGAGCCA TAGTGGTCTG 
CGGAACCGGT GAGTACACCG GAATTGCCAG GACGACCGGG TCCTTTCTTG 
GATCAACCCG CTCAATGCCT GGAGATTTGG GCGTGCCCCC GCGAGACTGC 
TAGCCGAGTA GTGTTGGGTC GCGAAAGGCC TTGTGGTACT GCCTGATAGG 
GTGCTTGCGA GTGCCCCGGG AGGTCTCGTA GACCGTGCAC CATGAGCACG 
AATCCTAAAC CTCAAAGAAA AACCAAAGGG CGCGCCATGA TTGAACAAGA 
TGGATTGCAC GCAGGTTCTC CGGCCGCTTG GGTGGAGAGG CTATTCGGCT 
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ATGACTGGGC ACAACAGACA ATCGGCTGCT 
CTGTCAGCGC AGGGGCGCCC GGTTCTTTTT 

5 

TGCCCTGAAT GAACTGCAGG ACGAGGCAGC 
CGACGGGCGT TCCTTGCGCA GCTGTGCTCG 

10 AGGGACTGGC TGCTATTGGG CGAAGTGCCG 
TCACCTTGCT CCTGCCGAGA AAGTATCCAT 

15 GGCTGCATAC GCTTGATCCG GCTACCTGCC 
CATCGCATCG AGCGAGCACG TACTCGGATG 
GGATGATCTG GACGAAGAGC ATCAGGGGCT 

20 

CCAGGCTCAA GGCGC GCATG CCCGACGGCG 
GGCGATGCCT GCTTGCCGAA TATCATGGTG 

25 

ATTCATCGAC TGTGGCCGGC TGGGTGTGGC 
CGTTGGCTAC CCGTGATATT GCTGAAGAGC 

30 CGCTTCCTCG TGCTTTACGG TATCGCCGCT 
CTTCTATCGC CTTCTTGACG AGTTCTTCTG 

35 GTTTCCCTCT AGCGGGATCA ATTCCGCCCC 
CGTTACTGGC CGAAGCCGCT TGGAATAAGG 
TGTTATTTTC CACCATATTG CCGTCTTTTG 

40 

CCTGGCCCTG TCTTCTTGAC GAGCATTCCT 
CAAAGGAATG CAAGGTCTGT TGAATGTCGT 

45 

AAGCTTCTTG AAGACAAACA ACGTCTGTAG 
AACCCCCCAC CTGGCGACAG GTGCCTCTGC 

50 AGATACACCT GCAAAGGCGG CACAACCCCA 
TAGTTGTGGA AAGAGTCAAA TGGCTCTCCT 

55 CTGAAGGATG CCCAGAAGGT ACCCCATTGT 
TCGGTGCACA TGCTTTACAT GTGTTTAGTC 
CCCCCCGAAC CACGGGGACG TGGTTTTCCT 

60 

ATGGACCGGG AGATGGCAGC ATCGTGCGGA 
GATACTCTTG ACCTTGTCAC CGCACTATAA 

65 

TATGGTGGTT ACAATATTTT ATCACCAGGG 



15 178 A 1 

CTGATGCCGC CGTGTTCCGG 500 

GTCAAGACCG ACCTGTCCGG 550 

GCGGCTATCG TGGCTGGCCA 600 

ACGTTGTCAC TGAAGCGGGA 650 

GGGCAGGATC TCCTGTCATC 700 

CATGGCTGAT GCAATGCGGC 750 

CATTCGACCA CCAAGCGAAA 800 

GAAGCCGGTC TTGTCGATCA 850 

CGCGCCAGCC GAACTGTTCG 900 

AGGATCTCGT CGTGACCCAT 950 

GAAAATGGCC GCTTTTCTGG 1000 

GGACCGCTAT CAGGACATAG 1050 

TTGGCGGCGA ATGGGCTGAC 1100 

CCCGATTCGC AGCGCATCGC 1150 

AGTTTAAACA GACCACAACG 1200 

TCTCCCTCCC CCCCCCCTAA 1250 

CCGGTGTGCG TTTGTCTATA 1300 

GCAATGTGAG GGCCCGGAAA 1350 

AGGGGTCTTT CCCCTCTCGC 1400 

GAAGGAAGCA GTTCCTCTGG 1450 

CGACCCTTTG CAGGCAGCGG 1500 

GGCCAAAAGC CACGTGTATA 1550 

GTGCCACGTT GTGAGTTGGA 1600 

CAAGCGTATT CAACAAGGGG 1650 

ATGGGATCTG ATCTGGGGCC 1700 

GAGGTTAAAA AACGTCTAGG 1750 

TTGAAAAACA CGATAATACC 1800 

GGCGCGGTTT TCGTAGGTCT 1850 

GCTGTTCCTC GCTAGGCTCA 1900 

CCGAGGCACA CTTGCAAGTG 1950 
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TGGATCCCCC CCCTCAACGT TCGGGGGGGC CGCGATGCCG TCATCCTCCT 2000 

CACGTGCGCG ATCCACCCAG AGCTAATCTT TACCATCACC AAAATCTTGC 2050 

TCGCCATACT CGGTCCACTC ATGGTGCTCC AGGCTGGTAT AACCAAAGTG 2100 

CCGTACTTCG TGCGCGCACA CGGGCTCATT CGTGCATGCA TGCTGGTGCG 2150 

GAAGGTTGCT GGGGGTCATT ATGTCCAAAT GGCTCTCATG AAGTTGGCCG 22.00 

CACTGACAGG TACGTACGTT TATGACCATC TCACCCCACT GCGGGACTGG 2250 

GCCCACGCGG GCCTACGAGA CCTTGCGGTG GCAGTTGAGC CCGTCGTCTT 2300 

CTCTGATATG GAGACCAAGG TTATCACCTG GGGGGCAGAC ACCGCGGCGT 2350 

GTGGGGACAT CATCTTGGGC CTGCCCGTCT CCGCCCGCAG GGGGAGGGAG 2400 

ATACATCTGG GACCGGCAGA CAGCCTTGAA GGGCAGGGGT GGCGACTCCT 24 50 

CGCGCCTATT ACGGCCTACT CCCAACAGAC GCGAGGCCTA CTTGGCTGCA 25 00 

TCATCACTAG CCTCACAGGC CGGGACAGGA ACCAGGTCGA GGGGGAGGTC 2550 

CAAGTGGTCT CCACCGCAAC ACAATCTTTC CTGGCGACCT GCGTCAATGG 2600 

CGTGTGTTGG ACTGTCTATC ATGGTGCCGG CTCAAAGACC CTTGCCGGCC 2650 

CAAAGGGCCC AATCACCCAA ATGTACACCA ATGTGGACCA GGACCTCGTC 2700 

GGCTGGCAAG CGCCCCCCGG. GGCGCGTTCC TTGACACCAT GCACCTGCGG 2750 

CAGCTCGGAC CTTTACTTGG TCACGAGGCA TGCCGATGTC ATTCCGGTGC 2800 

GCCGGCGGGG CGACAGCAGG GGGAGCCTAC TCTCCCCCAG GCCCGTCTCC 2850 

TACTTGAAGG GCTCTTCGGG CGGTCCACTG CTCTGCCCCT CGGGGCACGC 2900 

TGTGGGCATC TTTCGGGCTG CCGTGTGCAC CCGAGGGGTT GCGAAGGCGG 2950 

TGGACTTTGT ACCCGTCGAG TCTATGGAAA CCACTATGCG GTCCCCGGTC 3000 

TTCACGGACA ACTCGTCCCC TCCGGCCGTA CCGCAGACAT TCCAGGTGGC 3050 

CCATCTACAC GCCCCTACTG GTAGCGGCAA GAGCACTAAG GTGCCGGCTG 3100 

CGTATGCAGC CCAAGGGTAT AAGGTGCTTG TCCTGAACCC GTCCGTCGCC 3150 

GCCACCCTAG GTTTCGGGGC GTATATGTCT AAGGCACATG GTATCGACCC 3200 

TAACATCAGA ACCGGGGTAA GGACCATCAC CACGGGTGCC CCCATCACGT 3250 

ACTCCACCTA TGGCAAGTTT CTTGCCGACG GTGGTTGCTC TGGGGGCGCC 3300 

TATGACATCA TAATATGTGA TGAGTGCCAC TCAACTGACT CGACCACTAT 3350 

CCTGGGCATC GGCACAGTCC TGGACCAAGC GGAGACGGCT GGAGCGCGAC 3400 

TCGTCGTGCT CGCCACCGCT ACGCCTCCGG GATCGGTCAC CGTGCCACAT 34 50 



10 



15 



20 



25 



30 



35 



40 



45 



50 



55 



60 



65 
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CCAAACATCG 


AGGAGGTGGC 


TCTGTCCAGC 


ACTGGAGAAA 


TCCCCTTTTA 


3500 




TGGCAAAGCC 


ATCCCCATCG 


AGACCATCAA 


GGGGGGGAGG 


CACCTCATTT 


3550 


5 


TCTGCCATTC 


CAAGAAGAAA 


TGTGATGAGC 


TCGCCGCGAA 


GCTGTCCGGC 


3600 




CTCGGACTCA 


ATGCTGTAGC 


ATATTACCGG 


GGCCTTGATG 


TATCCGTCAT 


3650 


10 


ACCAACTAGC 


GGAGACGTCA 


TTGTCGTAGC 


AACGGACGCT 


CTAATGACGG 


3700 




GCTTTACCGG 


CGATTTCGAC 


TCAGTGATCG 


ACTGCAATAC 


ATGTGTCACC 


3750 


15 


CAGACAGTCG 


ACTTCAGCCT 


GGACCCGACC 


TTCACCATTG 


AGACGACGAC 


3800 




CGTGCCACAA 


GACGCGGTGT 


CACGCTCGCA GCGGCGAGGC 


AGGACTGGTA 


3850 


20 


GGGGCAGGAT 


GGGCATTTAC 


AGGTTTGTGA 


CTCCAGGAGA 


ACGGCCCTCG 


3900 




GGCATGTTCG 


ATTCCTCGGT 


TCTGTGCGAG 


TGCTATGACG 


CGGGCTGTGC 


3950 


25 


TTGGTACGAG 


CTCACGCCCG 


CCGAGACCTC 


AGTTAGGTTG 


CGGGCTTACC 


4000 


TAAACACACC 


AGGGTTGCCC 


GTCTGCCAGG 


ACCATCTGGA 


GTTCTGGGAG 


4050 




AGCGTCTTTA 


CAGGCCTCAC 


CCACATAGAC 


GCCCATTTCT 


TGTCCCAGAC 


4100 


30 


TAAGCAGGCA 


GGAGACAACT 


TCCCCTACCT 


GGTAGCATAC 


CAGGCTACGG 


4150 




TGTGCGCCAG 


GGCTCAGGCT 


CCACCTCCAT 


CGTGGGACCA AATGTGGAAG 


4200 


35 


TGTCTCATAC 


GGCTAAAGCC 


TACGCTGCAC 


GGGCCAACGC 


CCCTGCTGTA 


4250 




TAGGCTGGGA 


GCCGTTCAAA 


ACGAGGTTAC 


TACCACACAC 


CCCATAACCA 


4300 


40 


AATACATCAT 


GGCATGCATG 


TCGGCTGACC 


TGGAGGTCGT 


CACGAGCACC 


4350 




TGGGTGCTGG 


TAGGCGGAGT 


CCTAGCAGCT 


CTGGCCGCGT 


ATTGCCTGAC 


4400 




AACAGGCAGC 


GTGGTCATTG 


TGGGCAGGAT 


CATCTTGTCC 


GGAAAGCCGG 


4450 


45 


CCATCATTCC 


CGACAGGGAA 


GTCCTTTACC 


GGGAGTTCGA 


TGAGATGGAA 


4500 




GAGTGCGCCT 


CACACCTCCC 


TTACATCGAA CAGGGAATGC 


AGCTCGCCGA 


4550 


50 


ACAATTCAAA 


CAGAAGGCAA 


TCGGGTTGCT 


GCAAACAGCC 


ACCAAGCAAG 


4600 




CGGAGGCTGC 


TGCTCCCGTG 


GTGGAATCCA 


AGTGGCGGAC 


CCTCGAAGCC 


4650 


55 


TTCTGGGCGA 


AGCATATGTG 


GAATTTCATC 


AGCGGGATAC 


AATATTTAGC 


4700 




AGGCTTGTCC 


ACTCTGCCTG 


GCAACCCCGC 


GATAGCATCA 


CTGATGGCAT 


4750 


60 


TCACAGCCTC 


TATCACCAGC 


CCGCTCACCA 


CCCAACATAC 


CCTCCTGTTT 


4800* 


AACATCCTGG 


GGGGATGGGT 


GGCCGCCCAA CTTGCTCCTC 


CCAGCGCTGC 


4850 




TTCTGCTTTC 


GTAGGCGCCG 


GCATCGCTGG 


AGCGGCTGTT 


GGCAGCATAG 


4900 


65 


GCCTTGGGAA 


GGTGCTTGTG 


GATATTTTGG 


CAGGTTATGG 


AGCAGGGGTG 


4950 



26 



DE 199 15 178 A 1 

GCAGGCGCGC TCGTGGCCTT TAAGGTCATG AGCGGCGAGA TGCCCTCCAC 5000 

CGAGGACCTG GTTAACCTAC TCCCTGCTAT CCTCTCCCCT GGCGCCCTAG 5050 

TCGTCGGGGT CGTGTGCGCA GCGATACTGC GTCGGCACGT GGGCCCAGGG 5100 

GAGGGGGCTG TGCAGTGGAT GAACCGGCTG ATAGCGTTCG CTTCGCGGGG 5150 

TAACCACGTC TCCCCCACGC ACTATGTGCC TGAGAGCGAC GCTGCAGCAC 5200 

GTGTCACTCA GATCCTCTCT AGTCTTACCA TCACTCAGCT GCTGAAGAGG 5250 

CTTCACCAGT GGATCAACGA GGACTGCTCC ACGCCATGCT CCGGCTCGTG 5300 

GCTAAGAGAT GTTTGGGATT GGATATGCAC GGTGTTGACT GATTTCAAGA 5350 

CCTGGCTCCA GTCCAAGCTC CTGCCGCGAT TGCCGGGAGT CCCCTTCTTC 5400 

TCATGTCAAC GTGGGTACAA GGGAGTCTGG CGGGGCGACG GCATCATGCA 5450 

AACCACCTGC CCATGTGGAG C AC AG AT C AC CGGACATGTG AAAAACGGTT 5500 

CCATGAGGAT CGTGGGGCCT AGGACCTGTA GTAACACGTG GCATGGAACA 5550 

TTCCCCATTA ACGCGTACAC CACGGGCCCC TGCACGCCCT CCCCGGCGCC 5600 

AAATTATTCT AGGGCGCTGT GGCGGGTGGC TGCTGAGGAG TACGTGGAGG 5650 

TTACGCGGGT GGGGGATTTC CACTACGTGA CGGGCATGAC CACTGACAAC 5700 

GTAAAGTGCC CGTGTCAGGT TCCGGCCCCC GAATTCTTCA CAGAAGTGGA 5750 

TGGGGTGCGG TTGCACAGGT ACGCTCCAGC GTGCAAACCC CTCCTACGGG 5800 

AGGAGGTCAC ATTCCTGGTC GGGCTCAATC AATACCTGGT TGGGTCACAG 5850 

CTCCCATGCG AGCCCGAACC GGACGTAGCA GTGCTCACTT CCATGCTCAC 5900 

CGACCCCTCC CACATTACGG CGGAGACGGC TAAGCGTAGG CTGGCCAGGG 5950 

GATCTCCCCC CTCCTTGGCC AGCTCATCAG CTAGCCAGCT GTCTGCGCCT 6000 

TCCTTGAAGG CAACATGCAC TACCCGTCAT GACTCCCCGG ACGCTGACCT 6050 

CATCGAGGCC AACCTCCTGT GGCGGCAGGA GATGGGCGGG AACATCACCC 6100 

GCGTGGAGTC AGAAAATAAG GTAGTAATTT TGGACTCTTT CGAGCCGCTC 6150 

CAAGCGGAGG AGGATGAGAG GGAAGTATCC GTTCCGGCGG AGATCCTGCG 6200 

GAGGTCCAGG AAATTCCCTC GAGCGATGCC CATATGGGCA CGCCCGGATT 6250 

ACAACCCTCC ACTGTTAGAG TCCTGGAAGG ACCCGGACTA CGTCCCTCCA 6300 

GTGGTACACG GGTGTCCATT GCCGCCTGCC AAGGCCCCTC CGATACCACC 6350 

TCCACGGAGG AAGAGGACGG TTGTCCTGTC AGAATCTACC GTGTCTTCTG 6400 

CCTTGGCGGA GCTCGCCACA AAGACCTTCG GCAGCTCCGA ATCGTCGGCC 6450 
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GTCGACAGCG GCACGGCAAC GGCCTCTCCT GACCAGCCCT CCGACGACGG 6500 

CGACGCGGGA TCCGACGTTG AGTCGTACTC CTCCATGCCC CCCCTTGAGG 6550 

5 

GGGAGCCGGG GGATCCCGAT CTCAGCGACG GGTCTTGGTC TACCGTAAGC 6600 

GAGGAGGCTA GTGAGGACGT CGTCTGCTGC TCGATGTCCT ACACATGGAC 6650 

10 AGGCGCCCTG ATCACGCCAT GCGCTGCGGA GGAAACCAAG CTGCCCATCA 6700 

ATGCACTGAG CAACTCTTTG CTCCGTCACC ACAACTTGGT CTATGCTACA 6750 

is ACATCTCGCA GCGCAAGCCT GCGGCAGAAG AAGGTCACCT TTGACAGACT 6800 

GCAGGTCCTG GACGACCACT ACCGGGACGT GCTCAAGGAG ATGAAGGCGA 6850 

AGGCGTCCAC AGTTAAGGCT AAACTTCTAT CCGTGGAGGA AGCCTGTAAG 6900 

20 

CTGACGCCCC CACATTCGGC CAGATCTAAA TTTGGCTATG GGGCAAAGGA 6950 

CGTCCGGAAC CTATCCAGCA AGGCCGTTAA CCACATCCGC TCCGTGTGGA 7000 

25 

AGGACTTGCT GGAAGACACT GAGACACCAA TTGACACCAC CATCATGGCA 7050 

AAAAATGAGG TTTTCTGCGT CCAACCAGAG AAGGGGGGCC GCAAGCCAGC 7100 

30 TCGCCTTATC GTATTCCCAG ATTTGGGGGT TCGTGTGTGC GAGAAAATGG 7150 

CCCTTTACGA TGTGGTCTCC ACCCTCCCTC AGGCCGTGAT GGGCTCTTCA 7200 

35 TACGGATTCC AATACTCTCC TGGACAGCGG GTCGAGTTCC TGGTGAATGC 7250 

CTGGAAAGCG AAGAAATGCC CTATGGGCTT CGCATATGAC ACCCGCTGTT 7300 

TTGACTCAAC GGTCACTGAG AATGACATCC GTGTTGAGGA GTCAATCTAC 7350 

40 

CAATGTTGTG ACTTGGCCCC CGAAGCCAGA CAGGCCATAA GGTCGCTCAC 7400 

AGAGCGGCTT TACATCGGGG GCCCCCTGAC TAATTCTAAA GGGCAGAACT 7450 

45 

GCGGCTATCG CCGGTGCCGC GCGAGCGGTG TACTGACGAC CAGCTGCGGT 7500 

AATACCCTCA CATGTTACTT GAAGGCCGCT GCGGCCTGTC GAGCTGCGAA 7550 

50 GCTCCAGGAC TGCACGATGC TCGTATGCGG AGACGACCTT GTCGTTATCT 7600 

GTGAAAGCGC GGGGACCCAA GAGGACGAGG CGAGCCTACG GGCCTTCACG 7 650 

55 GAGGCTATGA CTAGATACTC TGCCCCCCCT GGGGACCCGC CCAAACCAGA 7700 

ATACGACTTG GAGTTGATAA CATCATGCTC CTCCAATGTG TCAGTCGCGC 7750 

ACGATGCATC TGGCAAAAGG GTGTACTATC TCACCCGTGA CCCCACCACC 78 00 

60 

CCCCTTGCGC GGGCTGCGTG GGAGACAGCT AGACACACTC CAGTCAATTC 7850 

CTGGCTAGGC AACATCATCA TGTATGCGCC CACCTTGTGG GCAAGGATGA 7 900 

65 TCCTGATGAC TCATTTCTTC TCCATCCTTC TAGCTCAGGA ACAACTTGAA 7 950 
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AAAGCCCTAG ATTGTCAGAT CTACGGGGCC TGTTACTCCA TTGAGCCACT 
TGACCTACCT CAGATCATTC AACGACTCCA TGGCCTTAGC GCATTTTCAC 
TCCATAGTTA CTCTCCAGGT GAGATCAATA GGGTGGCTTC ATGCCTCAGG 
AAACTTGGGG TACCGCCCTT GCGAGTCTGG AGACATCGGG CCAGAAGTGT 
CCGCGCTAGG CTACTGTCCC AGGGGGGGAG GGCTGCCACT TGTGGCAAGT 
ACCTCTTCAA CTGGGCAGTA AGGACCAAGC TCAAACTCAC TCCAATCCCG 
GCTGCGTCCC AGTTGGATTT ATCCAGCTGG TTCGTTGCTG GTTACAGCGG 
GGGAGACATA TATCACAGCC TGTCTCGTGC CCGACCCCGC TGGTTCATGT 
GGTGCCTACT CCTACTTTCT GTAGGGGTAG GCATCTATCT ACTCCCCAAC 
CGATGAACGG GGAGCTAAAC ACTCCAGGCC AATAGGCCAT CCTGTTTTTT 
TCCCTTTTTT TTTTTCTTTT 'pTTTTTTTTT TTTTT T TT TT TT ^^YTTTTT 
CTCCTTTTTT TTTCCTCTTT TTTTCCTTTT CTTTCCTTTG GTGGCTCCAT 
CTTAGCCCTA GTCACGGCTA GCTGTGAAAG GTCCGTGAGC CGCTTGACTG 
CAGAGAGTGC TGATACTGGC CTCTCTGCAG ATCAAGT 
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ANGABEN ZU SEQ ID-NO: 3 : 

SEQUENZCHARAKTERISTIKA: 
LANGE: 8001 Basenpaare 
ART: Nukleinsaure 
STRANGFORM: Einzelstrang 
10 TOPOLOGIE: linear 

ART DES MOLEKULS: Subgenom-RNA 

is HYPOTHETI SCH: Nein 

ANTI-SENSE, nein 

20 URSPRUNGLICHE HERKUNFT: 

ORGANISMUS: Hepatitis C Virus 

STAMM: Genotyp lb 
a ENTWICKLUNGSSTADIUM: — 

ZELLTYP: — 

UNMITTELBARE HERKUNFT: 
30 Isolat aus humanen Leberzellen 

MERKMAL: 

NAME/SCHLUSSEL: kodierende Sequenz for Virusproteine 
35 LAGE. — 

ERMITTLUNGSMETHODE: . experimentell 



40 



SEQUENZBESCHREIBUNG: SEQ ID-NO: 3 
I 3 e 9 /NS3-3'/wt: 8001 bp 



55 



60 



GCCAGCCCCC 


GATTGGGGGC 


GACACTCCAC 


CATAGATCAC 


TCCCCTGTGA 


50 


GGAACTACTG 


TCTTCACGCA 


GAAAGCGTCT 


AGCCATGGCG 


TTAGTATGAG 


100 


TGTCGTGCAG 


CCTCCAGGAC 


CCCCCCTCCC 


GGGAGAGCCA 


TAGTGGTCTG 


150 


CGGAACCGGT 


GAGTACACCG 


GAATTGCCAG 


GACGACCGGG 


TCCTTTCTTG 


200 


GATCAACCCG 


CTCAATGCCT 


GGAGATTTGG 


GCGTGCCCCC 


GCGAGACTGC 


250 


TAGCCGAGTA 


GTGTTGGGTC 


GCGAAAGGCC 


TTGTGGTACT 


GCCTGATAGG 


300 


GTGCTTGCGA 


GTGCCCCGGG AGGTCTCGTA 


GACCGTGCAC 


CATGAGCACG 


350 


AATCCTAAAC 


CTCAAAGAAA AACCAAACGT 


AACACCAACG 


GGCGCGCCAT 


400 
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GATTGAACAA GATGGATTGC ACGCAGGTTC TCCGGCCGCT TGGGTGGAGA 450 

GGCTATTCGG CTATGACTGG GCACAACAGA CAATCGGCTG CTCTGATGCC 500 

GCCGTGTTCC GGCTGTCAGC GCAGGGGCGC CCGGTTCTTT TTGTCAAGAC 550 

CGACCTGTCC GGTGCCCTGA ATGAACTGCA GGACGAGGCA GCGCGGCTAT 600 

CGTGGCTGGC CACGACGGGC GTTCCTTGCG CAGCTGTGCT CGACGTTGTC 650 

ACTGAAGCGG GAAGGGACTG GCTGCTATTG GGCGAAGTGC CGGGGCAGGA 700 

TCTCCTGTCA TCTCACCTTG CTCCTGCCGA GAAAGTATCC ATCATGGCTG 750 

ATGCAATGCG GCGGCTGCAT ACGCTTGATC CGGCTACCTG CCCATTCGAC 800 

CACCAAGCGA AACATCGCAT CGAGCGAGCA CGTACTCGGA TGGAAGCCGG 850 

TCTTGTCGAT CAGGATGATC TGGACGAAGA GCATCAGGGG CTCGCGCCAG 900 

CCGAACTGTT CGCCAGGCTC AAGGCGCGCA TGCCCGACGG CGAGGATCTC 950 

GTCGTGACCC ATGGCGATGC CTGCTTGCCG AATATCATGG TGGAAAATGG 1000 

CCGCTTTTCT GGATTCATCG ACTGTGGCCG GCTGGGTGTG GCGGACCGCT 1050 

ATCAGGACAT AGCGTTGGCT ACCCGTGATA TTGCTGAAGA GCTTGGCGGC 1100 

GAATGGGCTG ACCGCTTCCT CGTGCTTTAC GGTATCGCCG CTCCCGATTC 1150 

GCAGCGCATC GCCTTCTATC GCCTTCTTGA CGAGTTCTTC TGAGTTTAAA 1200 

CAGACCACAA CGGTTTCCCT CTAGCGGGAT CAATTCCGCC CCTCTCCCTC 1250 

CCCCCCCCCT AACGTTACTG GCCGAAGCCG CTTGGAATAA GGCCGGTGTG 1300 

CGTTTGTCTA TATGTTATTT TCCACCATAT TGCCGTCTTT TGGCAATGTG 1350 

AGGGCCCGGA AACCTGGCCC TGTCTTCTTG ACGAGCATTC CTAGGGGTCT 1400 

TTCCCCTCTC GCCAAAGGAA TGCAAGGTCT GTTGAATGTC GTGAAGGAAG 1450 

CAGTTCCTCT GGAAGCTTCT TGAAGACAAA CAACGTCTGT AGCGACCCTT 1500 

TGCAGGCAGC GGAACCCCCC ACCTGGCGAC AGGTGCCTCT GCGGCCAAAA 1550 

GCCACGTGTA TAAGATACAC CTGCAAAGGC GGCACAACCC CAGTGCCACG 1600 

TTGTGAGTTG GATAGTTGTG GAAAGAGTCA AATGGCTCTC CTCAAGCGTA 1650 

TTCAACAAGG GGCTGAAGGA TGCCCAGAAG GTACCCCATT GTATGGGATC 1700 

TGATCTGGGG CCTCGGTGCA CATGCTTTAC ATGTGTTTAG TCGAGGTTAA 1750 

AAAACGTCTA GGCCCCCCGA ACCACGGGGA CGTGGTTTTC CTTTGAAAAA 1800 

CACGATAATA CCATGGCGCC TATTACGGCC TACTCCCAAC AGACGCGAGG 1850 

CCTACTTGGC TGCATCATCA CTAGCCTCAC AGGCCGGGAC AGGAACCAGG 1900 
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TCGAGGGGGA GGTCCAAGTG GTCTCCACCG CAACACAATC TTTCCTGGCG 


1950 




ACCTGCGTCA ATGGCGTGTG TTGGACTGTC 


TATCATGGTG 


CCGGCTCAAA 


2000 


5 


GACCCTTGCC 


GGCCCAAAGG GCCCAATCAC 


CCAAATGTAC 


ACCAATGTGG 


2050 




ACCAGGACCT 


CGTCGGCTGG CAAGCGCCCC 


CCGGGGCGCG 


TTCCTTGACA 


2100 


10 


CCATGCACCT 


GCGGCAGCTC GGACCTTTAC 


TTGGTCACGA 


GGCATGCCGA 


2150 




TGTCATTCCG 


GTGCGCCGGC GGGGCGACAG 


CAGGGGGAGC 


CTACTPTPPP 


2200 


15 


CCAGGCCCGT 


CTCCTACTTG AAGGGCTCTT 


CGGGCGGTCP 


APTGPTPTGP 


2250 




CCCTCGGGGC 


ACGCTGTGGG CATCTTTCGG 


GCTGCCGTGT 


GPAPPPGAGG 


2300 


20 


GGTTGCGAAG 


GCGGTGGACT TTGTACCCGT 


PGAGTPTATG 




2350 




TGCGGTCCCC 


GGTCTTCACG GACAACTCGT 


CCCCTCCGGC 


CGT ACCGP AG 


2400 


25 


ACATTCCAGG 


TGGCCCATCT ACACGCCCCT 


ACTGGTAGCG 


HP A AG AGP AP 


2450 


TAAGGTGCCG 


GCTGCGTATG CAGCCCAAGG 


GTATAAGGTG 




2500 




ACCCGTCCGT 


CGCCGCCACC CTAGGTTTCG 


GGGCGTATAT 


nT r*T zi n can w 


2550 


30 


PATGGTATPG 


ACCCTAACAT CAGAACCGGG 


GTAAGGACCA 




2600 




TGCCCCCATP 


ACGTACTCCA CCTATGGCAA GTTTCTTGCC 




2650 


35 


GCTCTGGGGG 


CGCCTATGAC ATCATAATAT 


GTGATGAGTG 




2700 




GACTCGACCA 


CTATCCTGGG CATCGGCACA 


GTCCTGGACC 


A 2i gp r^fz zi n. a r* 


2750 


40 


GGCTGGAGPG 


CGACTCGTCG TGCTCGCCAC 


CGCTACGCCT 


CCGGGATCGG 


2800 




TCACCGTGCC 


ACATCCAAAC ATCGAGGAGG 


TGGCTCTGTC 


CAGCACTGGA 


2850 


45 


GAAATCCCCT 


TTTATGGCAA AGCCATCCCC 


ATCGAGACCA 


TCAAGGGGGG 


2900 


GAGGCACCTC 


ATTTTCTGCC ATTCCAAGAA 


GAAATGTGAT 


GAGCTCGCCG 


2950 




CGAAGCTGTC 


CGGCCTCGGA CTCAATGCTG 


TAGCATATTA CCGGGGCCTT 


3000 


50 


GATGTATCCG 


TCATACCAAC TAGCGGAGAC 


GTCATTGTCG 


TAGCAACGGA 


3050 




CGCTCTAATG 


ACGGGCTTTA CCGGCGATTT 


CGACTCAGTG 


ATCGACTGCA 


3100 


55 


ATACATGTGT 


CACCCAGACA GTCGACTTCA 


GCCTGGACCC 


GACCTTCACC 


3150 




ATTGAGACGA CGACCGTGCC ACAAGACGCG 


GTGTCACGCT 


CGCAGCGGCG 


3200 


60 


AGGCAGGACT 


GGTAGGGGCA GGATGGGCAT 


TTACAGGTTT 


GTGACTCCAG 


3250 


GAGAACGGCC 


CTCGGGCATG TTCGATTCCT 


CGGTTCTGTG 


CGAGTGCTAT 


3300 




GACGCGGGCT 


GTGCTTGGTA CGAGCTCACG 


CCCGCCGAGA 


CCTCAGTTAG 


3350 


65 


GTTGCGGGCT 


TACCTAAACA CACCAGGGTT 


GCCCGTCTGC 


CAGGACCATC 


3400 
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TGGAGTTCTG GGAGAGCGTC TTTACAGGCC TCACCCACAT AGACGCCCAT 3450 

TTCTTGTCCC AGACTAAGCA GGCAGGAGAC AACTTCCCCT ACCTGGTAGC 3500 

ATACCAGGCT ACGGTGTGCG CCAGGGCTCA GGCTCCACCT CCATCGTGGG 3550 

ACCAAATGTG GAAGTGTCTC ATACGGCTAA AGCCTACGCT GCACGGGCCA 3600 

ACGCCCCTGC TGTATAGGCT GGGAGCCGTT CAAAACGAGG TTACTACCAC 3650 

ACACCCCATA ACCAAATACA TCATGGCATG CATGTCGGCT GACCTGGAGG 3700 

TCGTCACGAG CACCTGGGTG CTGGTAGGCG GAGTCCTAGC AGCTCTGGCC 3750 

GCGTATTGCC TGACAACAGG CAGCGTGGTC ATTGTGGGCA GGATCATCTT 3800 

GTCCGGAAAG CCGGCCATCA TTCCCGACAG GGAAGTCCTT TACCGGGAGT 3850 

TCGATGAGAT GGAAGAGTGC GCCTCACACC TCCCTTACAT CGAACAGGGA 3900 

ATGCAGCTCG CCGAACAATT CAAACAGAAG GCAATCGGGT TGCTGCAAAC 3950 

AGCCACCAAG CAAGCGGAGG CTGCTGCTCC CGTGGTGGAA TCCAAGTGGC 4000 

GGACCCTCGA AGCCTTCTGG GCGAAGCATA TGTGGAATTT CATCAGCGGG 4050 

ATACAATATT TAGCAGGCTT GTCCACTCTG CCTGGCAACC CCGCGATAGC 4100 

ATCACTGATG GCATTCACAG CCTCTATCAC CAGCCCGCTC ACCACCCAAC 4150 

ATACCCTCCT GTTTAACATC CTGGGGGGAT GGGTGGCCGC CCAACTTGCT 4200 

CCTCCCAGCG CTGCTTCTGC TTTCGTAGGC GCCGGCATCG CTGGAGCGGC 4250 

TGTTGGCAGC ATAGGCCTTG GGAAGGTGCT TGTGGATATT TTGGCAGGTT 4300 

ATGGAGCAGG GGTGGCAGGC GCGCTCGTGG CCTTTAAGGT CATGAGCGGC 4350 

GAGATGCCCT CCACCGAGGA CCTGGTTAAC CTACTCCCTG CTATCCTCTC 4400 

CCCTGGCGCC CTAGTCGTCG GGGTCGTGTG CGCAGCGATA CTGCGTCGGC 4450 

ACGTGGGCCC AGGGGAGGGG GCTGTGCAGT GGATGAACCG GCTGATAGCG 4500 

TTCGCTTCGC GGGGTAACCA CGTCTCCCCC ACGCACTATG TGCCTGAGAG 4550 

CGACGCTGCA GCACGTGTCA CTCAGATCCT CTCTAGTCTT ACCATCACTC 4600 

AGCTGCTGAA GAGGCTTCAC CAGTGGATCA ACGAGGACTG CTCCACGCCA 4650 

TGCTCCGGCT CGTGGCTAAG AGATGTTTGG GATTGGATAT GCACGGTGTT 4700 

GACTGATTTC AAGACCTGGC TCCAGTCCAA GCTCCTGCCG CGATTGCCGG 4750 

GAGTCCCCTT CTTCTCATGT CAACGTGGGT ACAAGGGAGT CTGGCGGGGC 4800 

GACGGCATCA TGCAAACCAC CTGCCCATGT GGAGCACAGA TCACCGGACA 4850 

TGTGAAAAAC GGTTCCATGA GGATCGTGGG GCCTAGGACC TGTAGTAACA 4900 
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CGTGGCATGG AACATTCCCC ATTAACGCGT ACACCACGGG CCCCTGCACG 4 950 

CCCTCCCCGG CGCCAAATTA TTCTAGGGCG CTGTGGCGGG TGGCTGCTGA 5000 

5 

GGAGTACGTG GAGGTTACGC GGGTGGGGGA TTTCCACTAC GTGACGGGCA 5050 

TGACCACTGA CAACGTAAAG TGCCCGTGTC AGGTTCCGGC CCCCGAATTC 5100 

10 TTCACAGAAG TGGATGGGGT GCGGTTGCAC AGGTACGCTC CAGCGTGCAA 5150 

ACCCCTCCTA CGGGAGGAGG TCACATTCCT GGTCGGGCTC AATCAATACC 5200 

15 TGGTTGGGTC ACAGCTCCCA TGCGAGCCCG AACCGGACGT AGCAGTGCTC 5250 

ACTTCCATGC TCACCGACCC CTCCCACATT ACGGCGGAGA CGGCTAAGCG 5300 

TAGGCTGGCC AGGGGATCTC CCCCCTCCTT GGCCAGCTCA TCAGCTAGCC 5350 

20 

AGCTGTCTGC GCCTTCCTTG AAGGCAACAT GCACTACCCG TCATGACTCC 5400 

CCGGACGCTG ACCTCATCGA GGCCAACCTC CTGTGGCGGC AGGAGATGGG 5450 

25 

CGGGAACATC ACCCGCGTGG AGTCAGAAAA TAAGGTAGTA ATTTTGGACT 5500 

CTTTCGAGCC GCTCCAAGCG GAGGAGGATG AGAGGGAAGT ATCCGTTCCG 5550 

30 GCGGAGATCC TGCGGAGGTC CAGGAAATTC CCTCGAGCGA TGCCCATATG 5600 

GGCACGCCCG GATTACAACC CTCCACTGTT AGAGTCCTGG AAGGACCCGG 5650 

35 ACTACGTCCC TCCAGTGGTA CACGGGTGTC CATTGCCGCC TGCCAAGGCC 5700 

CCTCCGATAC CACCTCCACG GAGGAAGAGG ACGGTTGTCC TGTCAGAATC 5750 

TACCGTGTCT TCTGCCTTGG CGGAGCTCGC CACAAAGACC TTCGGCAGCT 5800 

40 

CCGAATCGTC GGCCGTCGAC AGCGGCACGG CAACGGCCTC TCCTGACCAG 5850 

CCCTCCGACG ACGGCGACGC GGGATCCGAC GTTGAGTCGT ACTCCTCCAT 5900 

45 

GCCCCCCCTT GAGGGGGAGC CGGGGGATCC CGATCTCAGC GACGGGTCTT 5950 

GGTCTACCGT AAGCGAGGAG GCTAGTGAGG ACGTCGTCTG CTGCTCGATG 6000 

50 TCCTACACAT GGACAGGCGC CCTGATCACG CCATGCGCTG CGGAGGAAAC 6050 

CAAGCTGCCC ATCAATGCAC TGAGCAACTC TTTGCTCCGT CACCACAACT 6100 

55 TGGTCTATGC TACAACATCT CGCAGCGCAA GCCTGCGGCA GAAGAAGGTC 6150 

ACCTTTGACA GACTGCAGGT CCTGGACGAC CACTACCGGG ACGTGCTCAA 6200 

GGAGATGAAG GCGAAGGCGT CCACAGTTAA GGCTAAACTT CTATCCGTGG 6250 

60 

AGGAAGCCTG TAAGCTGACG CCCCCACATT CGGCCAGATC TAAATTTGGC 6300 

TATGGGGCAA AGGACGTCCG GAACCTATCC AGCAAGGCCG TTAACCACAT 6350 

65 CCGCTCCGTG TGGAAGGACT TGCTGGAAGA CACTGAGACA CCAATTGACA 6400 



34 



CCACCATCAT GGCAAAAAAT 
GGCCGCAAGC CAGCTCGCCT 
GTGCGAGAAA ATGGCCCTTT 
TGATGGGCTC TTCATACGGA 
TTCCTGGTGA ATGCCTGGAA 
TGACACCCGC TGTTTTGACT 
AGGAGTCAAT CTACCAATGT 
ATAAGGTCGC TCACAGAGCG 
TAAAGGGCAG AACTGCGGCT 
CGACCAGCTG CGGTAATACC 
TGTCGAGCTG CGAAGCTCCA 
CCTTGTCGTT ATCTGTGAAA 
TACGGGCCTT CACGGAGGCT 
CCGCCCAAAC CAGAATACGA 
TGTGTCAGTC GCGCACGATG 
GTGACCCCAC CACCCCCCTT 
ACTCCAGTCA ATTCCTGGCT 
GTGGGCAAGG ATGATCCTGA 
AGGAACAACT TGAAAAAGCC 
TCCATTGAGC CACTTGACCT 
TAGCGCATTT TCACTCCATA 
CTTCATGCCT CAGGAAACTT 
CGGGCCAGAA GTGTCCGCGC 
CACTTGTGGC AAGTACCTCT 
TCACTCCAAT CCCGGCTGCG 
GCTGGTTACA GCGGGGGAGA 
CCGCTGGTTC ATGTGGTGCC 
ATCTACTCCC CAACCGATGA 
CCATCCTGTT TTTTTCCCTT 
TTTTTTTTTT TTTTCTCCTT 
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GAGGTTTTCT GCGTCCAACC AGAGAAGGGG 6450 

TATCGTATTC CCAGATTTGG GGGTTCGTGT 6500 

ACGATGTGGT CTCCACCCTC CCTCAGGCCG 6550 

TTCCAATACT CTCCTGGACA GCGGGTCGAG 6600 

AGCGAAGAAA TGCCCTATGG GCTTCGCATA 6650 

CAACGGTCAC TGAGAATGAC ATCCGTGTTG 6700 

TGTGACTTGG CCCCCGAAGC CAGACAGGCC 6750 

GCTTTACATC GGGGGCCCCC TGACTAATTC 6800 

ATCGCCGGTG CCGCGCGAGC GGTGTACTGA 6850 

CTCACATGTT ACTTGAAGGC CGCTGCGGCC 6900 

GGACTGCACG ATGCTCGTAT GCGGAGACGA 6950 

GCGCGGGGAC CCAAGAGGAC GAGGCGAGCC 7000 

ATGACTAGAT ACTCTGCCCC CCCTGGGGAC 7050 

CTTGGAGTTG ATAACATCAT GCTCCTCCAA 7100 

CATCTGGCAA AAGGGTGTAC TATCTCACCC 7150 

GCGCGGGCTG CGTGGGAGAC AGCTAGACAC 7200 

AGGCAACATC ATCATGTATG CGCCCACCTT 7250 

TGACTCATTT CTTCTCCATC CTTCTAGCTC 7300 

CTAGATTGTC AGATCTACGG GGCCTGTTAC 7350 

ACCTCAGATC ATTCAACGAC TCCATGGCCT 7400 

GTTACTCTCC AGGTGAGATC AATAGGGTGG 7450 

GGGGTACCGC CCTTGCGAGT CTGGAGACAT 7500 

TAGGCTACTG TCCCAGGGGG GGAGGGCTGC 7550 

TCAACTGGGC AGTAAGGACC AAGCTCAAAC 7600 

TCCCAGTTGG ATTTATCCAG CTGGTTCGTT 7 650 

CATATATCAC AGCCTGTCTC GTGCCCGACC 7700 

TACTCCTACT TTCTGTAGGG GTAGGCATCT 7750 

ACGGGGAGCT AAACACTCCA GGCCAATAGG 7800 

TTTTTTTTTC TTTTTTTTTT TTTTTTTTTT 7850 

TTTTTTTCCT CTTTTTTTCC TTTTCTTTCC 7900 
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TTTGGTGGCT CCATCTTAGC CCTAGTCACG GCTAGCTGTG AAAGGTCCGT 7950 
GAGCCGCTTG ACTGCAGAGA GTGCTGATAC TGGCCTCTCT GCAGATCAAG 8000 

5 

T 

10 

15 
20 
25 
30 
35 
40 
45 
50 
55 
60 
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ANGABEN ZU SEQ ID-N0:4 : 

SEQUENZCHARAKTERISTIKA: 
LANGE: 7989 Basenpaare 
ART: Nukleinsaure 
STRANGFORM. Einzelstrang 
TOPOLOGIE: linear 



UNMITTELBARE HERKUNFT: 

Isolat aus humanen Leberzellen 



SEQUENZBESCHREffiUNG: SEQ ID-NO: 4 
Ij„/NS3-3'/wt: 7989 bp 



10 



ART DES MOLEKULS: Subgenom-RNA 

HYPOTHETISCH: Nein is 
ANTI-SENSE: nein 

URSPRUNGLICHE HERKUNFT: 20 
ORGANISMUS. Hepatitis C Virus 
STAMM: Genotyp lb 
ENTWICKLUNGS STADIUM: — 
ZELLTYP: — 



25 



30 



MERKMAL: 

NAME/SCHLUSSEL: kodierende Sequenz fur Virusproteine 

LAGE — 35 

ERM1TTLUNGSMETHODE: . experimentell 



40 



45 



GCCAGCCCCC 


GATTGGGGGC 


GACACTCCAC 


CATAGATCAC 


TCCCCTGTGA 


50 


50 


GGAACTACTG 


TCTTCACGCA 


GAAAGCGTCT 


AGCCATGGCG 


TTAGTATGAG 


100 




TGTCGTGCAG 


CCTCCAGGAC 


CCCCCCTCCC 


GGGAGAGCCA 


TAGTGGTCTG 


150 


55 


CGGAACCGGT 


GAGTACACCG 


GAATTGCCAG 


GACGACCGGG 


TCCTTTCTTG 


200 




GATCAACCCG 


CTCAATGCCT 


GGAGATTTGG 


GCGTGCCCCC 


GCGAGACTGC 


250 


60 


TAGCCGAGTA 


GTGTTGGGTC 


GCGAAAGGCC 


TTGTGGTACT 


GCCTGATAGG 


300 


GTGCTTGCGA 


GTGCCCCGGG 


AGGTCTCGTA 


GACCGTGCAC 


CATGAGCACG 


350 




AATCCTAAAC CTCAAAGAAA AACCAAAGGG CGCGCCATGA TTGAACAAGA 


400 


65 
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TGGATTGCAC 


GCAGGTTCTC 


CGGCCGCTTG 


GGTGGAGAGG 


CTATTCGGCT 


450 




ATGACTGGGC 


ACAACAGACA ATCGGCTGCT 


CTGATGCCGC 


CGTGTTCCGG 


500 


5 


CTGTCAGCGC AGGGGCGCCC GGTTCTTTTT GTCAAGACCG ACCTGTCCGG 


550 




TGCCCTGAAT 


GAACTGCAGG 


ACGAGGCAGC 


GCGGCTATCG 


TGGCTGGCCA 


600 


10 


CGACGGGCGT 


TCCTTGCGCA 


GCTGTGCTCG 


ACGTTGTCAC 


TGAAGCGGGA 


650 




AGGGACTGGC 


TGCTATTGGG 


CGAAGTGCCG 


GGGCAGGATC 


TCCTGTCATC 


700 


15 


TCACCTTGCT 


CCTGCCGAGA 


AAGTATCCAT 


CATGGCTGAT 


GCAATGCGGC 


750 




GGCTGCATAC GCTTGATCCG GCTACCTGCC CATTCGACCA CCAAGCGAAA 


800 


20 


CATCGCATCG AGCGAGCACG 


TACTCGGATG 


GAAGCCGGTC 


TTGTCGATCA 


850 




GGATGATCTG 


GACGAAGAGC 


ATCAGGGGCT 


CGCGCCAGCC 


GAACTGTTCG 


900 


25 


CCAGGCTCAA 


GGCGCGCATG 


CCGGACGGCG 


AGGATCTCGT 


CGTGACCCAT 


950 


GGCGATGCCT 


GCTTGCCGAA 


TATCATGGTG 


GAAAATGGCC 


GCTTTTCTGG 


1000 




ATTCATCGAC 


TGTGGCCGGC 


TGGGTGTGGC 


GGACCGCTAT 


CAGGACATAG 


1050 


30 


CGTTGGCTAC 


CCGTGATATT 


GCTGAAGAGC 


TTGGCGGCGA ATGGGCTGAC 


1100 




CGCTTCCTCG 


TGCTTTACGG 


TATCGCCGCT 


CCCGATTCGC 


AGCGCATCGC 


1150 


35 


CTTCTATCGC 


CTTCTTGACG 


AGTTCTTCTG 


AGTTTAAACA 


GACCACAACG 


1200 




GTTTCCCTCT 


AGCGGGATCA 


ATTCCGCCCC 


TCTCCCTCCC 


CCCCCCCTAA 


1250 


40 


CGTTACTGGC 


CGAAGCCGCT 


TGGAATAAGG 


CCGGTGTGCG 


TTTGTCTATA 


1300 




TGTTATTTTC 


CACCATATTG 


CCGTCTTTTG 


GCAATGTGAG 


GGCCCGGAAA 


1350 




CCTGGCCCTG TCTTCTTGAC GAGCATTCCT AGGGGTCTTT CCCCTCTCGC 


1400 


45 


CAAAGGAATG CAAGGTCTGT TGAATGTCGT GAAGGAAGCA GTTCCTCTGG 


1450 




AAGCTTCTTG 


AAGACAAACA ACGTCTGTAG 


CGACCCTTTG 


CAGGCAGCGG 


1500 


50 


AACCCCCCAC 


CTGGCGACAG 


GTGCCTCTGC 


GGCCAAAAGC 


CACGTGTATA 


1550 




AGATACACCT 


GCAAAGGCGG 


CACAACCCCA 


GTGCCACGTT 


GTGAGTTGGA 


1600 


55 


TAGTTGTGGA 


AAGAGTCAAA 


TGGCTCTCCT 


CAAGCGTATT 


CAACAAGGGG 


1650 




CTGAAGGATG 


CCCAGAAGGT 


ACCCCATTGT 


ATGGGATCTG 


ATCTGGGGCC 


1700 


60 


TCGGTGCACA 


TGCTTTACAT 


GTGTTTAGTC 


GAGGTTAAAA AACGTCTAGG 


1750 


CCCCCCGAAC 


CACGGGGACG 


TGGTTTTCCT 


TTGAAAAACA 


CGATAATACC 


1800 




ATGGCGCCTA TTACGGCCTA CTCCCAACAG 


ACGCGAGGCC 


TACTTGGCTG 


1850 


65 


CATCATCACT 


AGCCTCACAG 


GCCGGGACAG 


GAACCAGGTC 


GAGGGGGAGG 


1900 
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TCCAAGTGGT CTCCACCGCA ACACAATCTT TCCTGGCGAC CTGCGTCAAT 1950 

GGCGTGTGTT GGACTGTCTA TCATGGTGCC GGCTCAAAGA CCCTTGCCGG 2000 

CCCAAAGGGC CCAATCACCC AAATGTACAC CAATGTGGAC CAGGACCTCG 2050 

TCGGCTGGCA AGCGCCCCCC GGGGCGCGTT CCTTGACACC ATGCACCTGC 2100 

GGCAGCTCGG ACCTTTACTT GGTCACGAGG CATGCCGATG TCATTCCGGT 2150 

GCGCCGGCGG GGCGACAGCA GGGGGAGCCT ACTCTCCCCC AGGCCCGTCT 2200 

CCTACTTGAA GGGCTCTTCG GGCGGTCCAC TGCTCTGCCC CTCGGGGCAC 2250 

GCTGTGGGCA TCTTTCGGGC TGCCGTGTGC ACCCGAGGGG TTGCGAAGGC 2300 

GGTGGACTTT GTACCCGTCG AGTCTATGGA AACCACTATG CGGTCCCCGG 2350 

TCTTCACGGA CAACTCGTCC CCTCCGGCCG TACCGCAGAC ATTCCAGGTG 2400 

GCCCATCTAC ACGCCCCTAC TGGTAGCGGC AAGAGCACTA AGGTGCCGGC 2450 

TGCGTATGCA GCCCAAGGGT ATAAGGTGCT TGTCCTGAAC CCGTCCGTCG 2500 

CCGCCACCCT AGGTTTCGGG GCGTATATGT CTAAGGCACA TGGTATCGAC 2550 

CCTAACATCA GAACCGGGGT AAGGACCATC ACCACGGGTG CCCCCATCAC 2600 

GTACTCCACC TATGGCAAGT TTCTTGCCGA CGGTGGTTGC TCTGGGGGCG 2650 

CCTATGACAT CATAATATGT GATGAGTGCC ACTCAACTGA CTCGACCACT 2700 

ATCCTGGGCA TCGGCACAGT CCTGGACCAA GCGGAGACGG CTGGAGCGCG 2750 

ACTCGTCGTG CTCGCCACCG CTACGCCTCC GGGATCGGTC ACCGTGCCAC 2800 

ATCCAAACAT CGAGGAGGTG GCTCTGTCCA GCACTGGAGA AATCCCCTTT 2850 

TATGGCAAAG CCATCCCCAT CGAGACCATC AAGGGGGGGA GGCACCTCAT 2900 

TTTCTGCCAT TCCAAGAAGA AATGTGATGA GCTCGCCGCG AAGCTGTCCG 2950 

GCCTCGGACT CAATGCTGTA GCATATTACC GGGGCCTTGA TGTATCCGTC 3000 

ATACCAACTA GCGGAGACGT CATTGTCGTA GCAACGGACG CTCTAATGAC 3050 

GGGCTTTACC GGCGATTTCG ACTCAGTGAT CGACTGCAAT ACATGTGTCA 3100 

CCCAGACAGT CGACTTCAGC CTGGACCCGA CCTTCACCAT TGAGACGACG 3150 

ACCGTGCCAC AAGACGCGGT GTCACGCTCG CAGCGGCGAG GCAGGACTGG 3200 

TAGGGGCAGG ATGGGCATTT ACAGGTTTGT GACTCCAGGA GAACGGCCCT 3250 

CGGGCATGTT CGATTCCTCG GTTCTGTGCG AGTGCTATGA CGCGGGCTGT 3300 

GCTTGGTACG AGCTCACGCC CGCCGAGACC TCAGTTAGGT TGCGGGCTTA 3350 

CCTAAACACA CCAGGGTTGC CCGTCTGCCA GGACCATCTG GAGTTCTGGG 3400 
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AGAGCGTCTT TACAGGCCTC 


ACCCACATAG 


ACGCCCATTT 


CTTGTCCCAG 


3450 


ACTAAGCAGG CAGGAGACAA CTTCCCCTAC CTGGTAGCAT ACCAGGCTAC 


3500 


GGTGTGCGCC AGGGCTCAGG 


CTCCACCTCC 


ATCGTGGGAC 


CAAATGTGGA 


3550 


AGTGTCTCAT ACGGCTAAAG 


CCTACGCTGC 


ACGGGCCAAC 


GCCCCTGCTG 


3600 


TATAGGCTGG GAGCCGTTCA 


AAACGAGGTT 


ACTACCACAC 


ACCCCATAAC 


3650 


CAAATACATC ATGGCATGCA 


TGTCGGCTGA 


CCTGGAGGTC 


GTCACGAGCA 


3700 


CCTGGGTGCT GGTAGGCGGA GTCCTAGCAG CTCTGGCCGC GTATTGCCTG 


3750 


ACAACAGGCA GCGTGGTCAT 


TGTGGGCAGG 


ATCATCTTGT 


CCGGAAAGCC 


3800 


GGCCATCATT CCCGACAGGG 


AAGTCCTTTA CCGGGAGTTC 


GATGAGATGG 


3850 


AAGAGTGCGC CTCACACCTC 


CCTTACATCG 


AACAGGGAAT 


GCAGCTCGCC 


3900 


GAACAATTCA AACAGAAGGC 


AATCGGGTTG 


CTGCAAACAG 


CCACCAAGCA 


3950 


AGCGGAGGCT GCTGCTCCCG 


TGGTGGAATC 


CAAGTGGCGG ACCCTCGAAG 


4000 


CCTTCTGGGC GAAGCATATG 


TGGAATTTCA 


TCAGCGGGAT 


ACAATATTTA 


4050 


GCAGGCTTGT CCACTCTGCC 


TGGCAACCCC 


GCGATAGCAT 


CACTGATGGC 


4100 


ATTCACAGCC TCTATCACCA GCCCGCTCAC 


CACCCAACAT 


ACCCTCCTGT 


4150 


TTAACATCCT GGGGGGATGG 


GTGGCCGCCC 


AACTTGCTCC 


TCCCAGCGCT 


4200 


GCTTCTGCTT TCGTAGGCGC 


CGGCATCGCT 


GGAGCGGCTG 


TTGGCAGCAT 


4250 


AGGCCTTGGG AAGGTGCTTG 


TGGATATTTT 


GGCAGGTTAT 


GGAGCAGGGG 


4300 


TGGCAGGCGC GCTCGTGGCC 


TTTAAGGTCA 


TGAGCGGCGA 


GATGCCCTCC 


4350 


ACCGAGGACC TGGTTAACCT 


ACTCCCTGCT 


ATCCTCTCCC 


CTGGCGCCCT 


4400 


AGTCGTCGGG GTCGTGTGCG 


CAGCGATACT 


GCGTCGGCAC 


GTGGGCCCAG 


4450 


GGGAGGGGGC TGTGCAGTGG 


ATGAACCGGC 


TGATAGCGTT 


CGCTTCGCGG 


4500 


GGTAACCACG TCTCCCCCAC 


GCACTATGTG 


CCTGAGAGCG 


ACGCTGCAGC 


4550 


ACGTGTCACT CAGATCCTCT 


CTAGTCTTAC 


CATCACTCAG 


CTGCTGAAGA 


4600 


GGCTTCACCA GTGGATCAAC 


GAGGACTGCT 


CCACGCCATG 


CTCCGGCTCG 


4650 


TGGCTAAGAG ATGTTTGGGA 


TTGGATATGC 


ACGGTGTTGA 


CTGATTTCAA 


4700 


GACCTGGCTC CAGTCCAAGC 


TCCTGCCGCG ATTGCCGGGA GTCCCCTTCT 


4750 


TCTCATGTCA ACGTGGGTAC 


AAGGGAGTCT 


GGCGGGGCGA CGGCATCATG 


4800 


CAAACCACCT GCCCATGTGG 


AGCACAGATC 


ACCGGACATG 


TGAAAAACGG 


4850 


TTCCATGAGG ATCGTGGGGC 


CTAGGACCTG 


TAGTAACACG 


TGGCATGGAA 


4900 
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CATTCCCCAT TAACGCGTAC ACCACGGGCC CCTGCACGCC CTCCCCGGCG 4950 

CCAAATTATT CTAGGGCGCT GTGGCGGGTG GCTGCTGAGG AGTACGTGGA 5000 

GGTTACGCGG GTGGGGGATT TCCACTACGT GACGGGCATG ACCACTGACA 5050 

ACGTAAAGTG CCCGTGTCAG GTTCCGGCCC CCGAATTCTT CACAGAAGTG 5100 

GATGGGGTGC GGTTGCACAG GTACGCTCCA GCGTGCAAAC CCCTCCTACG 5150 

GGAGGAGGTC ACATTCCTGG TCGGGCTCAA TCAATACCTG GTTGGGTCAC 5200 

AGCTCCCATG CGAGCCCGAA CCGGACGTAG CAGTGCTCAC TTCCATGCTC 5250 

ACCGACCCCT CCCACATTAC GGCGGAGACG GCTAAGCGTA GGCTGGCCAG 5300 

GGGATCTCCC CCCTCCTTGG CCAGCTCATC AGCTAGCCAG CTGTCTGCGC 5350 

CTTCCTTGAA GGCAACATGC ACTACCCGTC ATGACTCCCC GGACGCTGAC 5400 

CTCATCGAGG CCAACCTCCT GTGGCGGCAG GAGATGGGCG GGAACATCAC 5450 

CCGCGTGGAG TCAGAAAATA AGGTAGTAAT TTTGGACTCT TTCGAGCCGC 5500 

TCCAAGCGGA GGAGGATGAG AGGGAAGTAT CCGTTCCGGC GGAGATCCTG 5550 

CGGAGGTCCA GGAAATTCCC TCGAGCGATG CCCATATGGG CACGCCCGGA 5600 

TTACAACCCT CCACTGTTAG AGTCCTGGAA GGACCCGGAC TACGTCCCTC 5650 

CAGTGGTACA CGGGTGTCCA TTGCCGCCTG CCAAGGCCCC TCCGATACCA 5700 

CCTCCACGGA GGAAGAGGAC GGTTGTCCTG TCAGAATCTA CCGTGTCTTC 5750 

TGCCTTGGCG GAGCTCGCCA CAAAGACCTT CGGCAGCTCC GAATCGTCGG 5800 

CCGTCGACAG CGGCACGGCA ACGGCCTCTC CTGACCAGCC CTCCGACGAC 5850 

GGCGACGCGG GATCCGACGT TGAGTCGTAC TCCTCCATGC CCCCCCTTGA 5900 

GGGGGAGCCG GGGGATCCCG ATCTCAGCGA CGGGTCTTGG TCTACCGTAA 5950 

GCGAGGAGGC TAGTGAGGAC GTCGTCTGCT GCTCGATGTC CTACACATGG 6000 

ACAGGCGCCC TGATCACGCC ATGCGCTGCG GAGGAAACCA AGCTGCCCAT 6050 

CAATGCACTG AGCAACTCTT TGCTCCGTCA CCACAACTTG GTCTATGCTA 6100 

CAACATCTCG CAGCGCAAGC CTGCGGCAGA AGAAGGTCAC CTTTGACAGA 6150 

CTGCAGGTCC TGGACGACCA CTACCGGGAC GTGCTCAAGG AGATGAAGGC 6200 

GAAGGCGTCC ACAGTTAAGG CTAAACTTCT ATCCGTGGAG GAAGCCTGTA 6250 

AGCTGACGCC CCCACATTCG GCCAGATCTA AATTTGGCTA TGGGGCAAAG 6300 

GACGTCCGGA ACCTATCCAG CAAGGCCGTT AACCACATCC GCTCCGTGTG 6350 

GAAGGACTTG CTGGAAGACA CTGAGACACC AATTGACACC ACCATCATGG 6400 
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CAAAAAATGA GGTTTTCTGC GTCCAACCAG AGAAGGGGGG CCGCAAGCCA 6450 

GCTCGCCTTA TCGTATTCCC AGATTTGGGG GTTCGTGTGT GCGAGAAAAT 6500 

5 

GGCCCTTTAC GATGTGGTCT CCACCCTCCC TCAGGCCGTG ATGGGCTCTT 6550 

CATACGGATT CCAATACTCT CCTGGACAGC GGGTCGAGTT CCTGGTGAAT 6600 

10 GCCTGGAAAG CGAAGAAATG CCCTATGGGC TTCGCATATG ACACCCGCTG 6650 

TTTTGACTCA ACGGTCACTG AGAATGACAT CCGTGTTGAG GAGTCAATCT 6700 

15 ACCAATGTTG TGACTTGGCC CCCGAAGCCA GACAGGCCAT AAGGTCGCTC 6750 

ACAGAGCGGC TTTACATCGG GGGCCCCCTG ACTAATTCTA AAGGGCAGAA 6800 

CTGCGGCTAT CGCCGGTGCC GCGCGAGCGG TGTACTGACG ACCAGCTGCG 6850 

20 

GTAATACCCT CACATGTTAC TTGAAGGCCG CTGCGGCCTG TCGAGCTGCG 6900 

AAGCTCCAGG ACTGCACGAT GCTCGTATGC GGAGACGACC TTGTCGTTAT 6950 

25 

CTGTGAAAGC GCGGGGhCCC AAGAGGACGA GGCGAGCCTA CGGGCCTTCA 7000 

CGGAGGCTAT GACTAGATAC TCTGCCCCCC CTGGGGACCC GCCCAAACCA 7050 

30 GAATACGACT TGGAGTTGAT AACATCATGC TCCTCCAATG TGTCAGTCGC 7100 

GCACGATGCA TCTGGCAAAA GGGTGTACTA TCTCACCCGT GACCCCACCA 7150 

35 CCCCCCTTGC GCGGGCTGCG TGGGAGACAG CTAGACACAC TCCAGTCAAT 7200 

TCCTGGCTAG GCAACATCAT CATGTATGCG CCCACCTTGT GGGCAAGGAT 7250 

GATCCTGATG ACTCATTTCT TCTCCATCCT TCTAGCTCAG GAACAACTTG 7300 

40 

AAAAAGCCCT AGATTGTCAG ATCTACGGGG CCTGTTACTC CATTGAGCCA 7350 

CTTGACCTAC CTCAGATCAT TCAACGACTC CATGGCCTTA GCGCATTTTC 7400 

45 

ACTCCATAGT TACTCTCCAG GTGAGATCAA TAGGGTGGCT TCATGCCTCA 7450 

GGAAACTTGG GGTACCGCCC TTGCGAGTCT GGAGACATCG GGCCAGAAGT 7500 

50 GTCCGCGCTA GGCTACTGTC CCAGGGGGGG AGGGCTGCCA CTTGTGGCAA 7550 

GTACCTCTTC AACTGGGCAG TAAGGACCAA GCTCAAACTC ACTCCAATCC 7 600 

55 CGGCTGCGTC CCAGTTGGAT TTATCCAGCT GGTTCGTTGC TGGTTACAGC 7650 

GGGGGAGACA TATATCACAG CCTGTCTCGT GCCCGACCCC GCTGGTTCAT 7700 

GTGGTGCCTA CTCCTACTTT CTGTAGGGGT AGGCATCTAT CTACTCCCCA 7750 

60 

ACCGATGAAC GGGGAGCTAA ACACTCCAGG CCAATAGGCC ATCCTGTTTT 7800 

TTTCCCTTTT TTTTTTTCTT TTTTTTTTTT TTTTTTTTTT TTTTTTTTTT 7850 

65 

TTCTCCTTTT TTTTTCCTCT TTTTTTCCTT TTCTTTCCTT TGGTGGCTCC 7900 
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ATCTTAGCCC TAGTCACGGC TAGCTGTGAA AGGTCCGTGA GCCGCTTGAC 7950 
TGCAGAGAGT GCTGATACTG GCCTCTCTGC AGATCAAGT 
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ANGABEN ZU SEQ ID-NO: 5 : 

SEQUENZCHARAKTERISTDCA: 
LANGE: 8649 Basenpaare 
ART: Nukleinsaure 
STRANGFORM: Einzelstrang 
l0 TOPOLOGIE: linear 

ART DES MOLEKULS: Subgenom-RNA 

is HYPOTHETISCH: Nein 



ANTI-SENSE: nein 



URSPRUNGLICHE HERKUNFT: 

ORGANISMUS: Hepatitis C Virus 
STAMM: Genotyp lb 
ENTWICKLUNGSSTADIUM: — 
ZELLTYP: — 



UNMITTELBARE HERKUNFT: 
30 Isolat aus humanen Leberzellen 

MERKMAL: 

NAME/SCHLLFSSEL: kodierende Sequenz fur Virusproteine 
35 LAGE: — 

ERMITTLUNGSMETHODE: . experimental 



40 



45 SEQUENZBESCHREIBUNG: SEQ ID-NO: 5 
I 3 69/NS2-3'/wt: 8649 bp 

50 GCCAGCCCCC GATTGGGGGC GACACTCCAC CATAGATCAC TCCCCTGTGA 50 

GGAACTACTG TCTTCACGCA GAAAGCGTCT AGCCATGGCG TTAGTATGAG 100 

TGTCGTGCAG CCTCCAGGAC CCCCCCTCCC GGGAGAGCCA TAGTGGTCTG 150 

CGGAACCGGT GAGTACACCG GAATTGCCAG GACGACCGGG TCCTTTCTTG 200 

GATCAACCCG CTCAATGCCT GGAGATTTGG GCGTGCCCCC GCGAGACTGC -250 

TAGCCGAGTA GTGTTGGGTC GCGAAAGGCC TTGTGGTACT GCCTGATAGG 300 

GTGCTTGCGA GTGCCCCGGG AGGTCTCGTA GACCGTGCAC CATGAGCACG 350 

AATCCTAAAC CTCAAAGAAA AACCAAACGT AACACCAACG GGCGCGCCAT 400 
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GATTGAACAA GATGGATTGC ACGCAGGTTC TCCGGCCGCT TGGGTGGAGA 450 

GGCTATTCGG CTATGACTGG GCACAACAGA CAATCGGCTG CTCTGATGCC 500 

GCCGTGTTCC GGCTGTCAGC GCAGGGGCGC CCGGTTCTTT TTGTCAAGAC 550 

CGACCTGTCC GGTGCCCTGA ATGAACTGCA GGACGAGGCA GCGCGGCTAT 600 

CGTGGCTGGC CACGACGGGC GTTCCTTGCG CAGCTGTGCT CGACGTTGTC 650 

ACTGAAGCGG GAAGGGACTG GCTGCTATTG GGCGAAGTGC CGGGGCAGGA 700 

TCTCCTGTCA TCTCACCTTG CTCCTGCCGA GAAAGTATCC ATCATGGCTG 750 

ATGCAATGCG GCGGCTGCAT ACGCTTGATC CGGCTACCTG CCCATTCGAC 800 

CACCAAGCGA AACATCGCAT CGAGCGAGCA CGTACTCGGA TGGAAGCCGG 850 

TCTTGTCGAT CAGGATGATC TGGACGAA^A GCATCAGGGG CTCGCGCCAG 900 

CCGAACTGTT CGCCAGGCTC AAGGCGCGCA TGCCCGACGG CGAGGATCTC 950 

GTCGTGACCC ATGGCGATGC CTGCTTGCCG AATATCATGG TGGAAAATGG 1000 

CCGCTTTTCT GGATTCATCG ACTGTGGCCG GCTGGGTGTG GCGGACCGCT 1050 

ATCAGGACAT AGCGTTGGCT ACCCGTGATA TTGCTGAAGA GCTTGGCGGC 1100 

GAATGGGCTG ACCGCTTCCT CGTGCTTTAC GGTATCGCCG CTCCCGATTC 1150 

GCAGCGCATC GCCTTCTATC GCCTTCTTGA CGAGTTCTTC TGAGTTTAAA 1200 

CAGACCACAA CGGTTTCCCT CTAGCGGGAT CAATTCCGCC CCTCTCCCTC 1250 

CCCCCCCCCT AACGTTACTG GCCGAAGCCG CTTGGAATAA GGCCGGTGTG 1300 

CGTTTGTCTA TATGTTATTT TCCACCATAT TGCCGTCTTT TGGCAATGTG 1350 

AGGGCCCGGA AACCTGGCCC TGTCTTCTTG ACGAGCATTC CTAGGGGTCT 1400 

TTCCCCTCTC GCCAAAGGAA TGCAAGGTCT GTTGAATGTC GTGAAGGAAG 1450 

CAGTTCCTCT GGAAGCTTCT TGAAGACAAA CAACGTCTGT AGCGACCCTT 1500 

TGCAGGCAGC GGAACCCCCC ACCTGGCGAC AGGTGCCTCT GCGGCCAAAA 1550 

GCCACGTGTA TAAGATACAC CTGCAAAGGC GGCACAACCC CAGTGCCACG 1600 

TTGTGAGTTG GATAGTTGTG GAAAGAGTCA AATGGCTCTC CTCAAGCGTA 1650 

TTCAACAAGG GGCTGAAGGA TGCCCAGAAG GTACCCCATT GTATGGGATC 1700 

TGATCTGGGG CCTCGGTGCA CATGCTTTAC ATGTGTTTAG TCGAGGTTAA 1750 

AAAACGTCTA GGCCCCCCGA ACCACGGGGA CGTGGTTTTC CTTTGAAAAA 1800 

CACGATAATA CCATGGACCG GGAGATGGCA GCATCGTGCG GAGGCGCGGT 1850 

TTTCGTAGGT CTGATACTCT TGACCTTGTC ACCGCACTAT AAGCTGTTCC 1900 
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TCGCTAGGCT 


CATATGGTGG 


TTACAATATT 


TTATCACCAG 


GGCCGAGGCA 


1950 




CACTTGCAAG 


TGTGGATCCC 


CCCCCTCAAC 


GTTCGGGGGG 


GCCGCGATGC 


2000 


5 


CGTCATCCTC 


CTCACGTGCG 


CGATCCACCC 


AGAGCTAATC 


TTTACCATCA 


2050 




CCAAAATCTT 


GCTCGCCATA 


CTCGGTCCAC 


TCATGGTGCT 


CCAGGCTGGT 


2100 


10 


ATAACCAAAG 


TGCCGTACTT 


CGTGCGCGCA 


CACGGGCTCA 


TTCGTGCATG 


2150 




CATGCTGGTG 


CGGAAGGTTG 


CTGGGGGTCA TTATGTCCAA ATGGCTCTCA 


2200 


15 


TGAAGTTGGC 


CGCACTGACA GGTACGTACG 


TTTATGACCA TCTCACCCCA 


2250 




CTGCGGGACT 


GGGCCCACGC 


GGGCCTACGA 


GACCTTGCGG 


TGGCAGTTGA 


2300 


20 


GCCCGTCGTC 


TTCTCTGATA 


TGGAGACCAA 


GGTTATCACC 


TGGGGGGCAG 


2350 




ACACCGCGGC 


GTGTGGGGAC 


ATCATCTTGG 


GCCTGCCCGT 


CTCCGCCCGC 


2400 


25 


AGGGGGAGGG 


AGATACATCT 


GGGACCGGCA 


GACAGCCTTG 


AAGGGCAGGG 


2450 


GTGGCGACTC 


CTCGCGCCTA 


TTACGGCCTA 


CTCCCAACAG 


ACGCGAGGCC 


2500 




TACTTGGCTG 


CATCATCACT 


AGCCTCACAG 


GCCGGGACAG 


GAACCAGGTC 


2550 


30 


GAGGGGGAGG 


TCCAAGTGGT 


CTCCACCGCA ACACAATCTT 


TCCTGGCGAC 


2600 




CTGCGTCAAT 


GGCGTGTGTT 


GGACTGTCTA 


TCATGGTGCC 


GGCTCAAAGA 


2650 


35 


CCCTTGCCGG 


CCCAAAGGGC 


CCAATCACCC 


AAATGTACAC 


CAATGTGGAC 


2700 




CAGGACCTCG 


TCGGCTGGCA 


AGCGCCCCCC 


GGGGCGCGTT 


CCTTGACACC 


2750 


40 


ATGCACCTGC GGCAGCTCGG ACCTTTACTT GGTCACGAGG CATGCCGATG 


2800 




TCATTCCGGT 


GCGCCGGCGG 


GGCGACAGCA GGGGGAGCCT 


ACTCTCCCCC 


2850 


45 


AGGCCCGTCT 


CCTACTTGAA 


GGGCTCTTCG 


GGCGGTCCAC 


TGCTCTGCCC 


2900 


CTCGGGGCAC 


GCTGTGGGCA 


TCTTTCGGGC 


TGCCGTGTGC 


ACCCGAGGGG 


2950 




TTGCGAAGGC 


GGTGGACTTT 


GTACCCGTCG 


AGTCTATGGA AACCACTATG 


3000 


50 


CGGTCCCCGG 


TCTTCACGGA 


CAACTCGTCC 


CCTCCGGCCG 


TACCGCAGAC 


3050 




ATTCCAGGTG 


GCCCATCTAC 


ACGCCCCTAC 


TGGTAGCGGC 


AAGAGCACTA 


3100 


55 


AGGTGCCGGC 


TGCGTATGCA 


GCCCAAGGGT 


ATAAGGTGCT 


TGTCCTGAAC 


3150 




CCGTCCGTCG 


CCGCCACCCT 


AGGTTTCGGG 


GCGTATATGT 


CTAAGGCACA 


3200 


60 


TGGTATCGAC 


CCTAACATCA 


GAACCGGGGT 


AAGGACCATC 


ACCACGGGTG 


3250 


CCCCCATCAC 


GTACTCCACC 


TATGGCAAGT 


TTCTTGCCGA CGGTGGTTGC 


3300 




TCTGGGGGCG 


CCTATGACAT 


CATAATATGT 


GATGAGTGCC 


ACTCAACTGA 


3350 


65 


CTCGACCACT ATCCTGGGCA TCGGCACAGT 


CCTGGACCAA 


GCGGAGACGG 


3400 
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CTGGAGCGCG ACTCGTCGTG CTCGCCACCG CTACGCCTCC GGGATCGGTC 3450 

ACCGTGCCAC ATCCAAACAT CGAGGAGGTG GCTCTGTCCA GCACTGGAGA 3500 

AATCCCCTTT TATGGCAAAG CCATCCCCAT CGAGACCATC AAGGGGGGGA 3550 

GGCACCTCAT TTTCTGCCAT TCCAAGAAGA AATGTGATGA GCTCGCCGCG 3600 

AAGCTGTCCG GCCTCGGACT CAATGCTGTA GCATATTACC GGGGCCTTGA 3650 

TGTATCCGTC ATACCAACTA GCGGAGACGT CATTGTCGTA GCAACGGACG 3700 

CTCTAATGAC GGGCTTTACC GGCGATTTCG ACTCAGTGAT CGACTGCAAT 3750 

ACATGTGTCA CCCAGACAGT CGACTTCAGC CTGGACCCGA CCTTCACCAT 3800 

TGAGACGACG ACCGTGCCAC AAGACGCGGT GTCACGCTCG CAGCGGCGAG 3850 

GCAGGACTGG TAGGGGCAGG ATGGGCATTT ACAGGTTTGT GACTCCAGGA 3900 

GAACGGCCCT CGGGCATGTT CGATTCCTCG GTTCTGTGCG AGTGCTATGA 3950 

CGCGGGCTGT GCTTGGTACG AGCTCACGCC CGCCGAGACC TCAGTTAGGT 4000 

TGCGGGCTTA CCTAAACACA CCAGGGTTGC CCGTCTGCCA GGACCATCTG 4050 

GAGTTCTGGG AGAGCGTCTT TACAGGCCTC ACCCACATAG ACGCCCATTT 4100 

CTTGTCCCAG ACTAAGCAGG CAGGAGACAA CTTCCCCTAC CTGGTAGCAT 4150 

ACCAGGCTAC GGTGTGCGCC AGGGCTCAGG CTCCACCTCC ATCGTGGGAC 4200 

CAAATGTGGA AGTGTCTCAT ACGGCTAAAG CCTACGCTGC ACGGGCCAAC 4250 

GCCCCTGCTG TATAGGCTGG GAGCCGTTCA AAACGAGGTT ACTACCACAC 4300 

ACCCCATAAC CAAATACATC ATGGCATGCA TGTCGGCTGA CCTGGAGGTC 4350 

GTCACGAGCA CCTGGGTGCT GGTAGGCGGA GTCCTAGCAG CTCTGGCCGC 4400 

GTATTGCCTG ACAACAGGCA GCGTGGTCAT TGTGGGCAGG ATCATCTTGT 4450 

CCGGAAAGCC GGCCATCATT CCCGACAGGG AAGTCCTTTA CCGGGAGTTC 4500 

GATGAGATGG AAGAGTGCGC CTCACACCTC CCTTACATCG AACAGGGAAT 4550 

GCAGCTCGCC GAACAATTCA AACAGAAGGC AATCGGGTTG CTGCAAACAG 4600 

CCACCAAGCA AGCGGAGGCT GCTGCTCCCG TGGTGGAATC CAAGTGGCGG 4650 

ACCCTCGAAG CCTTCTGGGC GAAGCATATG TGGAATTTCA TCAGCGGGAT 4700 

ACAATATTTA GCAGGCTTGT CCACTCTGCC TGGCAACCCC GCGATAGCAT 4750 

CACTGATGGC ATTCACAGCC TCTATCACCA GCCCGCTCAC CACCCAACAT 4800 

ACCCTCCTGT TTAACATCCT GGGGGGATGG GTGGCCGCCC AACTTGCTCC 4850 

TCCCAGCGCT GCTTCTGCTT TCGTAGGCGC CGGCATCGCT GGAGCGGCTG 4 900 
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TTGGCAGCAT AGGCCTTGGG AAGGTGCTTG TGGATATTTT GGCAGGTTAT 4 950 

GGAGCAGGGG TGGCAGGCGC GCTCGTGGCC TTTAAGGTCA TGAGCGGCGA 5000 

5 

GATGCCCTCC ACCGAGGACC TGGTTAACCT ACTCCCTGCT ATCCTCTCCC 5050 

CTGGCGCCCT AGTCGTCGGG GTCGTGTGCG CAGCGATACT GCGTCGGCAC 5100 

10 GTGGGCCCAG GGGAGGGGGC TGTGCAGTGG ATGAACCGGC TGATAGCGTT 5150 

CGCTTCGCGG GGTAACCACG TCTCCCCCAC GCACTATGTG CCTGAGAGCG 5200 

15 ACGCTGCAGC ACGTGTCACT CAGATCCTCT CTAGTCTTAC CATCACTCAG 5250 

CTGCTGAAGA GGCTTCACCA GTGGATCAAC GAGGACTGCT CCACGCCATG 5300 

CTCCGGCTCG TGGCTAAGAG ATGTTTGGGA TTGGATATGC ACGGTGTTGA 5350 

20 

CTGATTTCAA GACCTGGCTC CAGTCCAAGC TCCTGCCGCG ATTGCCGGGA 5400 

GTCCCCTTCT TCTCATGTCA ACGTGGGTAC AAGGGAGTCT GGCGGGGCGA 5450 

25 

CGGCATCATG CAAACCACCT GCCCATGTGG AGCACAGATC ACCGGACATG 5500 

TGAAAAACGG TTCCATGAGG ATCGTGGGGC CTAGGACCTG TAGTAACACG 5550 

30 TGGCATGGAA CATTCCCCAT TAACGCGTAC ACCACGGGCC CCTGCACGCC 5600 

CTCCCCGGCG CCAAATTATT CTAGGGCGCT GTGGCGGGTG GCTGCTGAGG 5650 

35 AGTACGTGGA GGTTACGCGG GTGGGGGATT TCCACTACGT GACGGGCATG 5700 

ACCACTGACA ACGTAAAGTG CCCGTGTCAG GTTCCGGCCC CCGAATTCTT 5750 

CACAGAAGTG GATGGGGTGC GGTTGCACAG GTACGCTCCA GCGTGCAAAC 5800 

40 

CCCTCCTACG GGAGGAGGTC ACATTCCTGG TCGGGCTCAA TCAATACCTG 5850 

GTTGGGTCAC AGCTCCCATG CGAGCCCGAA CCGGACGTAG CAGTGCTCAC 5900 

45 

TTCCATGCTC ACCGACCCCT CCCACATTAC GGCGGAGACG GCTAAGCGTA 5950 

GGCTGGCCAG GGGATCTCCC CCCTCCTTGG CCAGCTCATC AGCTAGCCAG 6000 

50 CTGTCTGCGC CTTCCTTGAA GGCAACATGC ACTACCCGTC ATGACTCCCC 6050 

GGACGCTGAC CTCATCGAGG CCAACCTCCT GTGGCGGCAG GAGATGGGCG 6100 

55 GGAACATCAC CCGCGTGGAG TCAGAAAATA AGGTAGTAAT TTTGGACTCT 6150 

TTCGAGCCGC TCCAAGCGGA GGAGGATGAG AGGGAAGTAT CCGTTCCGGC 6200 

GGAGATCCTG CGGAGGTCCA GGAAATTCCC TCGAGCGATG CCCATATGGG 6250 

60 

CACGCCCGGA TTACAACCCT CCACTGTTAG AGTCCTGGAA GGACCCGGAC 6300 

TACGTCCCTC CAGTGGTACA CGGGTGTCCA TTGCCGCCTG CCAAGGCCCC 6350 

65 

TCCGATACCA CCTCCACGGA GGAAGAGGAC GGTTGTCCTG TCAGAATCTA 6400 
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CCGTGTCTTC TGCCTTGGCG GAGCTCGCCA CAAAGACCTT CGGCAGCTCC 6450 

GAATCGTCGG CCGTCGACAG CGGCACGGCA ACGGCCTCTC CTGACCAGCC 6500 

CTCCGACGAC GGCGACGCGG GATCCGACGT TGAGTCGTAC TCCTCCATGC 6550 

CCCCCCTTGA GGGGGAGCCG GGGGATCCCG ATCTCAGCGA CGGGTCTTGG 6600 

TCTACCGTAA GCGAGGAGGC TAGTGAGGAC GTCGTCTGCT GCTCGATGTC 6650 

CTACACATGG ACAGGCGCCC TGATCACGCC ATGCGCTGCG GAGGAAACCA 6700 

AGCTGCCCAT CAATGCACTG AGCAACTCTT TGCTCCGTCA CCACAACTTG 6750 

GTCTATGCTA CAACATCTCG CAGCGCAAGC CTGCGGCAGA AGAAGGTCAC 6800 

CTTTGACAGA CTGCAGGTCC TGGACGACCA CTACCGGGAC GTGCTCAAGG 6850 

AGATGAAGGC GAAGGCGTCC ACAGTTAAGG CTAAACTTCT ATCCGTGGAG 6900 

GAAGCCTGTA AGCTGACGCC CCCACATTCG GCCAGATCTA AATTTGGCTA 6950 

TGGGGCAAAG GACGTCCGGA ACCTATCCAG CAAGGCCGTT AACCACATCC 7000 

GCTCCGTGTG GAAGGACTTG CTGGAAGACA CTGAGACACC AATTGACACC 7050 

ACCATCATGG CAAAAAATGA GGTTTTCTGC GTCCAACCAG AGAAGGGGGG 7100 

CCGCAAGCCA GCTCGCCTTA TCGTATTCCC AGATTTGGGG GTTCGTGTGT 7150 

GCGAGAAAAT GGCCCTTTAC GATGTGGTCT CCACCCTCCC TCAGGCCGTG 7200 

ATGGGCTCTT CATACGGATT CCAATACTCT CCTGGACAGC GGGTCGAGTT 7250 

CCTGGTGAAT GCCTGGAAAG CGAAGAAATG CCCTATGGGC TTCGCATATG 7300 

ACACCCGCTG TTTTGACTCA ACGGTCACTG AGAATGACAT CCGTGTTGAG 7350 

GAGTCAATCT ACCAATGTTG TGACTTGGCC CCCGAAGCCA GACAGGCCAT 7400 

AAGGTCGCTC ACAGAGCGGC TTTACATCGG GGGCCCCCTG ACTAATTCTA 7450 

AAGGGCAGAA CTGCGGCTAT CGCCGGTGCC GCGCGAGCGG TGTACTGACG 7500 

ACCAGCTGCG GTAATACCCT CACATGTTAC TTGAAGGCCG CTGCGGCCTG 7550 

TCGAGCTGCG AAGCTCCAGG ACTGCACGAT GCTCGTATGC GGAGACGACC 7600 

TTGTCGTTAT CTGTGAAAGC GCGGGGACCC AAGAGGACGA GGCGAGCCTA 7650 

CGGGCCTTCA CGGAGGCTAT GACTAGATAC TCTGCCCCCC CTGGGGACCC 7700 

GCCCAAACCA GAATACGACT TGGAGTTGAT AACATCATGC TCCTCCAATG 7750 

TGTCAGTCGC GCACGATGCA TCTGGCAAAA GGGTGTACTA TCTCACCCGT 7800 

GACCCCACCA CCCCCCTTGC GCGGGCTGCG TGGGAGACAG CTAGACACAC 7850 

TCCAGTCAAT TCCTGGCTAG GCAACATCAT CATGTATGCG CCCACCTTGT 7900 
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GGGCAAGGAT GATCCTGATG ACTCATTTCT 


TCTCCATCCT 


TCTAGCTCAG 


7950 




GAACAACTTG AAAAAGCCCT 


AGATTGTCAG 


ATCTACGGGG 


CCTGTTACTC 


8000 


5 


CATTGAGCCA CTTGACCTAC 


CTCAGATCAT 


TCAACGACTC 


CATGGCCTTA 


8050 




GCGCATTTTC ACTCCATAGT 


TACTCTCCAG 


GTGAGATCAA 


TAGGGTGGCT 


8100 


10 


TCATGCCTCA GGAAACTTGG 


GGTACCGCCC 


TTGCGAGTCT 


GGAGACATCG 


8150 




GGCCAGAAGT GTCCGCGCTA GGCTACTGTC 


CCAGGGGGGG 


AGGGCTGCCA 


8200 


15 


CTTGTGGCAA GTACCTCTTC 


AACTGGGCAG 


TAAGGACCAA 


GCTCAAACTC 


8250 




ACTCCAATCC CGGCTGCGTC 


CCAGTTGGAT 


TTATCCAGCT 


GGTTCGTTGC 


8300 


20 


TGGTTACAGC GGGGGAGACA TATATCACAG 


CCTGTCTCGT 


GCCCGACCCC 


8350 




GCTGGTTCAT GTGGTGCCTA 


CTCCTACTTT 


CTGTAGGGGT 


AGGCATCTAT 


8400 


25 


CTACTCCCCA ACCGATGAAC 


GGGGAGCTAA 


ACACTCCAGG 


CCAATAGGCC 


8450 


ATCCTGTTTT TTTCCCTTTT 


TTTTTTTCTT 


TTTTTTTTTT 


TTTTTTTTTT 


8500 




TTTTTTTTTT TTCTCCTTTT 


TTTTTCCTCT 


TTTTTTCCTT 


TTCTTTCCTT 


8550 


30 


TGGTGGCTCC ATCTTAGCCC 


TAGTCACGGC 


TAGCTGTGAA AGGTCCGTGA 


8600 




GCCGCTTGAC TGCAGAGAGT 


GCTGATACTG 


GCCTCTCTGC 


AGATCAAGT 





35 Patentanspriiche 

1. Hepatitis C Virus (HCV) Zcllkullursystem, das im wesentlichcn cukaryontische Zellen umfaBt, die eingcschleu- 
stes HCV-spezifisches Genmaterial enthalten, dadurch gekennzeichnet, daB die eukaryontischen Zellen humane 
Hepatomazellen sind und daB das eingeschleuste HCV-spezifische Genmaterial ein HCV-RNA-Konstrukt ist, das 

40 die HCV-spezifischen RNA-Abschnitle 5'NTR, NS3, NS4A, NS4B, NS5A, NS5B und 3'NTR und zusatzlich ein se- 

lektierbares Markergen (Selektionsgen) umfaBt. 

2. Zcllkultursystcm nach Anspruch 1 , dadurch gekennzeichnet, daB die Hepatomazellen von ciner handclsublichcn 
Hepatomazellinie abstammen. 

3. Zellkultursystem nach Anspruch 1, dadurch gekennzeichnet, daB die Hepatomazellen aus einer Hepatomapri- 
45 marzcllkulturgcwonncn sind. 

4. HCV-RNA-Konstrukt, dadurch gekennzeichnet, daB es die HCV-spezifischen RNA-Abschnitte 5'NTR, NS3, 
NS4A, NS4B, NS5A, NS5B und 3'NTR umfafit. 

5. HCV-RNA-Konstrukt nach Anspruch 4, dadurch gekennzeichnet, daB es die in Sequenzprotokoll SEQ ID NO: 1 
dargestellle Nukleotidsequenz umfaBt. 

50 6. HCV-RNA-Konstrukt nach Anspruch 4, dadurch gekennzeichnet, daB es die in Sequenzprotokoll SEQ ID NO: 2 

dargestellte Nukleotidsequenz umfaBt. 

7. HCV-RNA-Konstrukt nach Anspruch 4, dadurch gekennzeichnet, daB es die in Sequenzprotokoll SEQ ID NO: 3 
dargestellte Nukleotidsequenz umfaBt. 

8. HCV-RNA-Konstrukt nach Anspruch 4, dadurch gekennzeichnet, daB es die in Sequenzprotokoll SEQ ID NO: 4 
55 dargestellte Nukleotidsequenz umfaBt. 

9. HCV-RNA-Konstrukt. nach Anspruch 4, dadurch gekennzeichnet, daB es die in Sequenzprotokoll SEQ ID NO: 5 
dargestellte Nukleotidsequenz umfaBt. 

10. HCV-RNA-Konstrukt nach Anspruch 4, dadurch gekennzeichnet, daB die 3'NTR eine Nukleotidsequenz auf- 
weist, die aus der Gruppe der nachfolgend aufgelisteten Nukleotidsequenzen (a) bis (i) ausgewahlt ist: 
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(a) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTTTTT 
TTAGCTTTTTTTTTTTTCTTTTTTTTTGAGAGAGAGAGTCTCACTCTG 
TTGCCCAGACTGGAGT 

(b) acggggack:taaacactccackk:caataggccatcctgtttttt 

TTTTT AGTCT TTTTTTTTTC TTTTTTTTGA GAGAGAGAGT 
CTCACTCTGT TGCCCAGACT GGAGC 

(c) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTAATCTTT TTTTTTTTCT TTTTTTTTGA GAGAGAGAGT 
CTCACTCTGT TGCCCAGACT GCAGC 

(d) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTTTAGTC TTTTTTTTTT TCTTTTTTTT TGAGAGAGAG 
AGTCTCACTC TGTTGCCCAG ACTGGAGT 

(e) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTT AGTCT TTTTTTTTTT TCTTTTTTTT TGAGAGAGAG 
AGTCTCACTC TGTTGCCCAG ACTGGAGT 

(f) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTT AGTCT XTTTTTTTTT TCTTTTTTTT TTGAGAGAGA 
GAGTCTCACT CTGTTGCCCA GACTGGAGT 

(g) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTT AGTCT TTTTTTTTTT CTTTTTTTTT GAGAGAGAGA 
GTCTCACTCT GTTGCCCAGA CTGGAGT 

(h) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTTTTAAT CTTTTTTTTT TTTTTCCTTT TTTTGAGAGA 
GAGAGTCTC A CTCTGTTGCC C AGACTGGAG T 

(i) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTTTAATC TTTTTTTTTT TTTTCTTTTT TTTTTGAGAG 
AGAGAGTCTC ACTCTGTTGC CCAGACTGGA GT 

1 1 . HCV-RNA-Konstrukt nach einem der Anspriiche 4 bis 10, dadurch gekennzeichnet, daB das seiektierbare Mar- 
kergen ein Resistenzgen und insbesondere eine Antibiolikaresistenzgen ist. 

12. HCV-RNA-Konstrukt nach einem der Anspriiche 4 bis 10, dadurch gekennzeichnet, daG das seiektierbare Mar- 
kergen ein Neomycinphosphotransferasegen ist. 

13. HCV-RNA-Konstrukt nach einem der Anspriiche 4 bis 12, dadurch gekennzeichnet, daB das seiektierbare Mar- 
kergen strangabwarts der 5'NTR in die HCV-RNA integriert ist. 

14. HCV-RNA-Konstrukt nach einem der Anspriiche 4 bis 13, dadurch gekennzeichnet, daB das seiektierbare Mar- 
kergen iiber ein Ribozym bzw. eine Erkennungsstelle fur ein Ribozym mil der HCV-RNA verbunden ist. 

15. HCV-RNA-Konstrukt nach einem der Anspriiche 4 bis 14, dadurch gekennzeichnet, daB es ein integriertes Re- 
portcrgen aufwcist. 

16. HCV-RNA-Konstrukt nach Anspruch 15, dadurch gekennzeichnet, daB das Reportergen ein Gen aus der 
Gruppe der Luziferasegene, dem CAT-Gen (Chloramphenicol-Acetayl-Transferase-Gen), dem lacZ-Gen (beta-Ga- 
laktosidasegen), der GFP-Gene (green-fluorescence-protein-Gene), dem GUS-Gen (Glukuronidasegen) und dem 
SEAP-Gen (Sezernierte-AIkalische-Phosphatase-Gen) ist. 

17. HCV-RNA-Konstrukt nach einem der Anspriiche 4 bis 15, dadurch gekennzeichnet, daB dcrcn Rcplikation die 
Expression eines (zellularen) Surrogatmarkergens beeinfluBt. 

18. HCV-RNA-Konstrukt nach einem der Anspriiche 15 bis 17, dadurch gekennzeichnet, daB das Resistenzgen 
derart in das offene Leseraster der HCV-RNA einidoniert ist, daB es erst nach einer proteolytischen Prozessierung in 
eine aktive Form uberfuhrbar ist. 

1 9. HCV-RNA-Konstrukt nach einem der Anspriiche 15 bis 1 8, dadurch gekennzeichnet, daB das Reportergen und 
das seiektierbare Markergen derart raumlich in dem Konstrukt angeordnet sind, daB sie gemeinsam ein Fusionspro- 
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tein exprimieren. 

20. Zcllkultursystcm nach cincm der Anspriichc 1 bis 3, dadurch gekcnnzcichnet, daB das HCV-RNA-Konstrukt 
ein Konsirukt gemaB wenigstens einem der Anspriiche 4 bis 19 ist. 

21. Zellkultursystern nach Anspruch 1, dadurch gekennzeichnet, daB die das HCV-RNA-Konstrukt enthaltenden 
5 Zcllen bei der DSMZ, Braunschweig, BRD, unter der Hinterlegungsnummer DSM ACC2394 (Laborbezeichnung 

HuBI9-13)hinterIegtsind. 

22. Verwendung eines Zellkultursystems nach einem der Anspriiche 1 bis 3 oder 20 bis 21 und/oder eines HCV- 
RNA-Konstrukts nach einem der Anspriiche 4 bis 19 zur Herstellung und/oder Evaluierung und/oder Testung von 
Therapeutika und/oder Diagnostika zur Behandlung von insbesondere HCV-Infektionen. 

10 23. Verwendung eines Zellkultursystems nach einem der Anspriiche 1 bis 3 oder 20 bis 21 und/oder eines HCV- 

RNA-Konstrukts nach einem der Anspriiche 4 bis 19 zur Herstellung eines Impfstoffes gegen HCV-Infektionen. 

24. Verwendung eines HCV-RNA-Konslrukts nach einem der Anspriiche 4 bis 19 zur Herstellung einer leberzell- 
spezifischen Gcnfahre fiir die Gentherapie. 

25. HCV-RNA-Konstrukt nach einem der Anspriiche 4 bis 19, dadurch gekennzeichnet, daB es ein integriertes 
15 Fremdgen aufweist und dazu geeignet ist, dieses Fremdgen in eine Zielzelle einzuschleusen, die zur Expression die- 
ses Frcmdgens geeignet ist. 
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